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Beschreibuna 

Gegenstand der Erfindung ist ein Verfahren zur fermentativen Herstellung von schwefelhaltigen 
Feinchemikalien, insbesondere L-Methionin, unterVerwendung von Bakterien, indenen einefur 
ein O-Acetyl-Homoserin-Sulfhydrolase (metY)-Gen kodierende Nukleotidsequenzen exprimiert 
wird. 

Stand der Tech nik 

Schwefelhaltige Feinchemikalien, wie zum Beispiel Methionin, Homocystein, S-Adenosyl- 
Methionin, Glutathion, Cystein, Biotin, Thiamin, Liponsaure werden uber natiirtiche Stoffwech- 
selprozesse in Zellen hergestellt und werden in vielen Industriezweigen verwendet, einschlieft- 
lich der Nahrungsmittel-, Futtermittel-, Kosmetik- und pharmazeutischen Industrie. Diese Sub- 
stanzen, die zusammen als "schwefelhaltige Feinchemikalien" bezeichnet werden, umfassen 
organische SSuren, sowohl proteinogene als auch nicht-proteinogene Aminosauren, Vitamine 
und Cofaktoren. Ihre Produktion erfolgtam zweckmaBigsten im Groftmaftstab mittels Anzucht 
von Bakterien, die entwickelt wurden, urn grolie Mengen der jeweils gewOnschten Substanzzu 
produzieren und sezernieren. FOr diesen Zweck besonders geeignete Organismen sind coryne- 
forme Bakterien, gram-positive nicht-pathogene Bakterien. 

Es ist bekannt, dass Aminosauren durch Fermentation von Stammen coryneformer Bakterien, 
insbesondere Corynebacterium glutamicum, hergestellt werden. Wegen dergrolien Bedeutung 
wird standig an der Verbesserung der Herstellverfahren gearbeitet. Verfahrensverbesserungen 
konnen fermentationstechnische MalSnahmen, wie zum Beispiel Running und Versorgung mit 
Sauerstoff, Oder die Zusammensetzung der Nahrmedien, wie zum Beispiel die Zuckerkonzentra- 
tion wahrend der Fermentation, oder die Aufarbeitung zum Produkt , beispielsweise durch lone- 
naustauschchromatographie, Oder die intrinsischen Leistungseigenschaften des Mikroorganis- 
mus selbst betreffen. 

Ober Stammselektion sind eine Reihe von Mutantenstammen entwickelt worden, die ein Sorti- 
ment wunschenswerter Verbindungen aus der Reihe der schwefelhaltigen Feinchemikalien pro- 
duzieren. Zur Verbesserung der Leistungseigenschaften dieser Mikroorganismen hinsichtlich der 
Produktion eines bestimmten MolekOls werden Methoden der Mutagenese, Selektion und Mut- 
antenauswahl angewendet. Dies ist jedoch ein zeitaufwendiges und schwieriges Verfahren. Auf 
diese Weise erhalt man z.B. Stamme, die resistent gegen Antimetabolite, wie z. B. die Methio- 
nin-Analoga a-Methyl-Methionin, Ethionin, Norleucin, N-Acetylnorleucin, S-Trifluoromethyl- 
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homocystein, 2-Amino-5-heprenoitsaure, Seleno-Methionin, Methioninsulfoximin. Methoxin. 1- 
Aminocyclopentan-Carboxylsaure oder auxotroph fur regulatorisch bedeutsame Metabolite slnd 
und schwefelhaltige Feinchemikalien, wie z. B. L-Methionin. produzieren. 

Seit einigen Jahren werden ebenfalls Methoden der rekombinanten DNA-Technik zur Stamm- 
verbesserung von L-Aminosaure produzierender Stamme von Corynebacterium eingesetzt, in- 
dem man einzelne Aminosaure-Biosynthesegene amplifizlert und die Auswirkung auf die Amino- 
saure-Produktion untersucht. 

Die WO-A-02/1 861 3 beschreibt die Nukleinsaure- und AminosauresequenzfQr metY aus C. Glu- 
tamicum und dessen Verwendung zur Herstellung von L-Lysin. 

Kurze B eschreibunq der Erfindung 

Der Erfindung lag die Aufgabe zugrunde, ein neues Verfahren zur verbesserten fermentativen 
Herstellung von schwefelhaltige Feinchemikalien, insbesondere L-Methionin, bereitzustellen. 

Gelost wird obige Aufgabe durch Bereitstellung eines Verfahrens zur fermentativen Herstellung 
einerschwefelhaltigen Feinchemikalie, umfassend die Expression einerheterologen Nukleotid- 
sequenz, welche fOr ein Protein mit metY-Aktivitat kodiert, in einem coryneformen Bakterium. 

Ein erster Gegenstand der Erfindung ist Verfahren zur fermentativen Herstellung wenigstens 
einerschwefelhaltigen Feinchemikalie, welches folgende Schritte umfasst: 

a) Fermentation einer die gewOnschte schwefelhaltige Feinchemikalie produzierenden co- 
ryneformen Bakterienkultur, wobei in den coryneformen Bakterien zumindesteine hetero- 
loge Nukleotidsequenz exprimiert wird, welche fOr ein Protein mit O-Acetyl-Homoserin- 
Sulfhydrolase (metY) -Aktivitat kodiert; 

b) Anreicherung der schwefelhaltigen Feinchemikalie im Medium oder in den Zellen der 
Bakterien, und 

c) Isolieren der schwefelhaltigen Feinchemikalie, welche vorzugsweise L-Methionin um- 
fasst 



Vorzugsweise besitzt obige heterologe metY-kodierende Nukleotidsequenz zur metY- 
kodierenden Sequenzaus Corynebacterium glutamicum ATCC 13032 eine Sequenzhomologie 
von weniger als 100%, wie z.B. mehr als 70%, wie 75, 80, 85, 90 oder 95 %, oder weniger als 
70%, wie z.B. bis zu 60, 50, 40, 30. 20 oder 10 %. Die metY-kodierende Sequenz ist vorzugs- 
weise aus einem derfolgenden Organismen von Liste I abgeleitet: 
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Liste I 



Corvnebacterium diDhteriae 


ATCP 14770 


Mycobacterium tuberculosis 


ATPP 9SSR4 


CDC1551 




Clostridium acetobutylicum 


AlUO Oat 


Bacillus halodurans 


ATPP9 1 SOI 

A 1 V' VsZ 1 J7 1 


Bacillus stearothermnnViiliiQ 




Chlorobium tenirinim 


a tpp zto/^s^ 


Svnechococcu^ sn 


ATPP971 HA 


Emericella nirfulan^ 


a tpp fiyf 

/VI JOIUH 


Bacteroides frafHliQ 

uvvvi viuwo 1 1 nf\\ 1 1 IT 


ATPP 9S78S 

/V 1 V-/V^ ZjZoj \ 


Lactococcus lactic 




Bordetella broncbi^entipfi 


ATPP lO^QS 


Pseudomonas aeruoino^a 


ATCC 170^^ 


Nitrosomonas euronaea 


ATPP 1 071 8 


Sinorhizobium meliloti 


ATPP 


Therm oto £?a maritima 

■* "V* AU w O * fcXXXXCl 


ATPP A^SRO 


Strentococcns mutant 


ATPP 9S1 7S 


Burlcholderia cenaria 


ATCC £ 


T^einococciis "raHinHivranc 

IS viilUvvvv Ug X QUluUlU <U Id 


ATPP 1 


Rhodobacter capsulatus 


ATCC 11166 


Pasteurella multocida 


ATCC 6530 


Clostridium difficile 


ATCC 9689 


Campylobacter j ej uni 


ATCC 33560 


Streptococcus pneumoniae 


ATCC 6308 


Saccharomyces cerevisiae 


ATCC 2704 


Kluyveromyces lactis 


ATCC 8585 


Candida albicans 


ATCC 10231 


Schizosaccharomyces pombe 


ATCC 24969 



ATCC: American Type Culture Collection, Rockville, MD, USA 

Die erfindungsgemali eingesetzte metY-kodierende Sequenz umfasst vorzugsweise eine kodie- 
rende Sequenz gemali SEQ ID N0:1 , 3, 5, 7, 9, 1 1 , 1 3, 1 5, 1 7, 1 9, 21 , 23, 25, 27, 29, 31 , 33, 35, 
37, 39, 41 , 43, 45, 47, 49, 51 und 53 oder eine dazu homologe Nukleotidsequenz, welche fOr ein 
Protein mit metY-Aktivitat kodiert, umfasst. 



Die erfindungsgemali eingesetzte metY-kodierende Sequenz kodiert aulierdem vorzugsweise 
fur ein Protein mit metY-Aktivitat, wobei das Protein eine Aminosauresequenz gemali SEQ ID 
NO:2, 4. 6, 8, 10, 12, 14. 16, 18. 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 
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und 54 odereine dazu homologe Aminosauresequenz, welche fOr ein Protein mit metY-Aktivitat 
steht, umfasst 

Die kodierende metY-Sequenz ist vorzugsweise eine in coryneformen Bakterien replizierbare 
oder eine stabil in das Chromosom intregrierte DNA oder eine RNA. 

Gemaft einer bevorzugten AusfQhrungsform wird das erfindungsgemafte Verfahren durchge- 
fuhrt, indem man 

a) e ' n enmiteinemPlasmidvektortransfo™^^ 

eine Kopiederkodierenden metY-Sequenz unter derKontrolleregulativerSequenzentragt^ oder 

b) einen Stamm einsetzt, in dem die kodierende metY-Sequenz in das Chromosom des 
Bakteriums integriert wurde 

Es ist weiterhin bevorzugt, die kodierende metY-Sequenz fOr die Fermentation zu Qberexprimie- 
ren. 

Aulierdem kann es wQnschenswert sein, Bakterien zu fermentieren, in denen zusatzlich wenigs- 
tens ein weiteres Gen des Biosyntheseweges der gewOnschten schwefeihaltigen Feinchemikalie 
verstarkt ist; und / oder 

in denen wenigstens ein Stoffwechselweg zumindest teilweise ausgeschaltet sind, der die Bil- 
dung der gewOnschten schwefeihaltigen Feinchemikalie verringert 

Aulierdem kann es wQnschenswert sein, Bakterien zu fermentieren, in denen zusatzlich wenigs- 
tens ein weiteres Gen des Biosyntheseweges der gewOnschten schwefeihaltigen Feinchemikalie 
durch Stoffwechselmetabolite in seiner Aktivitat nicht in unerwOnschter Weise beeinflusst wird. 

Gemali einer weiteren AusfQhrungsform des erfindungsgemalien Verfahrens werden deshalb 
coryneforme Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt 
unter 

a) dem fOr eine Aspartatkinase kodierenden Gen lysC, 

b) dem fur eine Aspartat-Semialdehyd-Dehydrogenase kodierenden Gen asd 

c) dem fOr die Glycerinaldehyd-3-Phosphat Dehydrogenase kodierenden Gen gap, 

d) dem fQr die 3-Phosphoglycerat Kinase kodierenden Gen pgk, 

e) dem fQr die Pyruvat Carboxylase kodierenden Gen pyc, 

f) dern fOr die Triosephosphat Isomerase kodierenden Gen tpi, 



M/43128 



BASF Aktiengesi 



aft 



20020291 
5 




0000053876 



9) 

h) 

i) 

j) 

k) 

") 

m) 

n) 

o) 



dem fur die Homoserin O-Acetyltransferase kodierenden Gen metA, 
dem fOr die Cystahionin-gamma-Synthase kodierenden Gen metB, 
dem fdr die Cystahionin-gamma-Lyase kodierenden Gen metC, 
dem far die Serin-Hydroxymethyltransferase kodierenden Gen glyA, 
dem far die Methionin Synthase kodierenden Gen metH, 
dem fOr die Methylen-Tetrahydrofolat-Reduktase kodieren Gen, metF 
dem fOr die Phosphoserin-Aminotransferase kodieren Gen serC 
dem for die Phosphoserin-Phosphatase kodieren Gen serB, 
dem fOr die Serine Acetyl-Transferase kodieren Gen cysE, 



p) dem far die Homoserin-Dehydrogenase kodieren Gen horn, 
aberexprimiert ist. 

Gemaft einer anderen Ausfahrungsform des erfindungsgemSIJen Verfahrens werden corynefor- 
me Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene ausgewahlt unter 
Genen der oben genannten Gruppe a) bis p) mutiert ist, so dass die korrespondierenden Protei- 
ne, verglichen mit nicht mutierten Proteinen, in geringerem Made oder nichtdurch Stoffwech- 
selmetabolite in ihrer Aktivitat beeinflusst werden und dass insbesondere die erfindungsgemafie 
Produktion der Feinchemikalie nicht beeintrSchtigt wird. 

Gemaft einer anderen Ausfahrungsform des erfindungsgemaften Verfahrens werden corynefor- 
me Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt unter 
q) dem fOr die Homoserine-Kinase kodierenden Gen thrB, 
r) dem fOr die Threonin Dehydratase kodierenden Gen ilvA, 
s) dem fOr die Threonin Synthase kodierenden Gen thrC 
t) dem fOr die Meso-Diaminopimelat D-Dehydrogenase kodierenden Gen ddh 
u) dem fOr die Phosphoenolpyruvat-Carboxykinase kodierenden Gen pck, 
v) dem fOr die Glucose-6-Phosphat-6-lsomerase kodierenden Gen pgi, 
w) dem fOr die Pyruvat-Oxidase kodierenden Gen poxB, 
x) dem fur die Dihydrodipicolinat Synthase kodiernden Gen dapA, 
y) dem fOr die Dihydrodipicolinat Reduktase kodiernden Gen dapB; oder 
z) dem fOr die Diaminopicolinat Decarboxylase kodiernden Gen lysA 
abschwacht ist, insbesondere durch Verringerung der Expressionsrate des korrespondierenden 



Gemaft einer anderen Ausfahrungsform des erfindungsgemafJen Verfahrens werden corynefor- 
me Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene der obigen Gruppen 



Gens. 
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q) bis z) mutiert 1st, so dass die enzymatische Aktivitat des korrespondierenden Proteins teilwei- 
se oder vollstandig verringert wird. 

Vorzugsweise werden in dem erfindungsgemafien Verfahren Mikroorganismen der ArtCoryne- 
bacterium glutamicum eingesetzt. 

Ein weiterer Gegenstand der Erfindung betrifft ein Verfahren zur Herstellung eines L-Methionin- 
haltigen Tierfuttermittel-Additivs aus Fermentationsbruhen, welches folgende Schritte umfasst 

a) Kultivierung und Fermentation eines L-Methionin produzierenden Mikroorganis- 
mus in einem Fermentationsmedium; 

b) Entfernung von Wasser aus der L-Methionin haltigen Fermentationsbruhe; 

c) Entfernung der wahrend der Fermentation gebildeten Biomasse in einer Menge 
von 0 bis 100 Gew.-%; und 

d) Trocknung der gemafi b) und/oder c) erhaltenen Fermentationsbruhe, urn das 
Tierfuttermittel-Additiv in der gewQnschten Pulver- oder Granulatform zu erhalten. 

Gegenstand der Erfindung sind ebenfalls die erstmalig aus obigen Mikroorganismen isolierten 
kodierenden metY-Sequenzen, die davon kodierten O-Acetyl-Homoserin-Sulfhydrolasen sowie 
die funktionaien Homologen dieser Polynukieotide bzw. Proteine. 

Detaillierte Beschreibuna der Erfindung 

a) Allgemeine Begriffe 

Als Proteine mit der Aktivitat der O-Acetyl-Homoserin Sulfhydrolase auch metY (EC 4.2.99.1 0) 
genannt, werden solche Proteine beschrieben, die in der Lage sind O-Acetyl-Homoserin und 
Sulfid unterVerwendung des Cofaktors Pyrodoxal-Phosphat zu Homocystein umzusetzen. Der 
Fachmann unterscheidet die Aktivivat der O-Acetyl-Homoserin Sulfhydrolase von der O- 
Succinyl-Homoserin-Sulfhydrolase auch metZgenannt. In dem letztgenannten Enzym dient O- 
Succinyl-Homoserin und nicht O-Acetyl-Homoserin als Substrat der Reaktion. Der Fachmann 
kann die enzymatische Aktivivtat von rnetH durch Enzymtests nachweisen, Vorschriften dafur 
konnen sein: Shimizu H. Yamagata S. Masui R. Inoue Y. Shibata T. Yokoyama S. Kuramitsu S. 
Iwama T. Biochimica et Biophysica Acta. 1549(1 ):61-72, 2001 , Yamagata S. Isaji M. Nakamura 
K. Fujisaki S. Doi K. Bawden S. D'Andrea R. Applied Microbiology & Biotechnology. 42(1):92-9, 
1994 
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lm Rahmen der vorliegenden Erfindung umfasst der Begriff n schwefelhaltige Feinchemikalie" 
jegliche chemische Verbindung, die wenigstens ein Schwefelatom kovalent gebunden enthalt 
und durch ein erfindungsgemalies Fermentationsverfahrens zuganglich ist. Nichtlimitierende 
Beispiele dafur sind Methionin, Homocystein, S-Adenosyl-Methionin, insbesondere Methionin, 
und S-Adenosyl-Methionin. 

Im Rahmen der vorliegenden Erfindung umfassen die Begriffe M L-Methionin w , w Methionin M , Ho- 
mocystein und S-Adenosylmethionin auch die korrespondierenden Salze, wie z. B, Methionin- 
Hydrochlorid oder Methionin-Sulfat. 

"Polynukleotide" bezeichnet im allgemeinen Polyribonukleotide (RNA) und Polydeoxyribonukleo- 
tide (DNA), wobei es sich urn nicht modifizierte RNA oder DN A oder modifizierte RNA oder DNA 
handeln kann. 

Unter "Polypeptide^ 1 versteht man erfindungsgemali Peptide oder Proteine, die zwei oder mehr 
Ober Peptidbindungen verbundene Aminosauren enthalten. 

Der Begriff n Stoffwechselmetabolit" bezeichnet chemische Verbindungen, die im Stoffwechsel 
von Organismen als Zwischen- oder auch Endprodukte vorkommen und die neben ihrerEigen- 
schaft als chemische Bausteine auch modulierende Wirkung auf Enzyme und ihre katalytische 
Aktivitat haben konnen. Dabei ist aus der Literatur bekannt, dass solche Stoffwechselmetabolite 
sowohl hemmend als auch stimulierend auf die Aktvitat von Enzymen wirken konnen (Bioche- 
mistry, Stryer, Lubert, 1995 W. H. Freeman & Company, New York, New York.). In der Literatur 
ist auch beschrieben, dass es moglich ist durch MafLnahmen wie Mutation der genomischen 
DNA durch UV-Strahlung, ionisierender Strahlung oder mutagene Substanzen und nachfolgen- 
der Selektion auf bestimmte Phanotypen in Organismen solche Enzyme zu produzieren, in de- 
nen die Beeinflussung durch Stoffwechselmetabolite verandert wurde (Sahm H. Eggeling L de 
Graaf AA. Biological Chemistry 381 (9-1 0):899-910, 2000; Eikmanns BJ. Eggeling L. Sahm H. 
Antonie van Leeuwenhoek. 64:145-63, 1993-94). Diese veranderten Eigenschaften konnen auch 
durch gezielte Maflnahmen erreicht werden. Dabei istdem Fachmann bekannt, dass in Gene fur 
Enzyme auch gezielt bestimmte Nukleotide derfQr das Protein kodierenden DNA so zu veran- 
dern, dass das aus der exprimierten DNA-Sequenz resultierende Protein bestimmte neue Ei- 
genschaften aufweist, so zum Beispiel, dass die modulierende Wirkung von Stoffwechselmeta- 
boliten gegenQber dem nicht veranderten Protein verandert ist 

Enzyme konnen derart in ihrer Aktivitat beeinfluflt werden, dass es zu einer Verringerung der 
Reaktionsgeschwindigkeit, oderzu einer Veranderung der Affinitat gegenQber dem Substrat o- 
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der zu einer Anderung der Reaktionsgeschwindigkeiten 

Die Begriffe "exprimieren" bzw. "Verstarkung" oder „Oberexpression" beschreiben im Kontext der 
Erfindung die Produktion bzw. Erhohung der intrazellularen Aktivitat eines oder mehrerer Enzy- 
me in einem Mikroorganismus, die durch die entsprechende DNA kodiert werden. Dazu kann 
man beispielsweise ein Gen in einen Organismus einbringen, ein vorhandenes Gen durch ein 
anderes Gen ersetzen, die Kopienzahl des Gens bzw. der Gene erhohen, einen starken Promo- 
tor verwenden oder ein Gen verwenden, das fur ein entsprechendes Enzym mit einer hohen 
Aktivitat kodiert und man kann gegebenenfalls diese Mafinahmen kombinieren. 

b) Erfindungsgemafie metY-Proteine 

Erfindungsgemali mit umfasst sind ebenfalls „funktiona!e Aquivalente" der konkret offenbarten 
metY-Enzyme aus Organismen obiger Liste I. 

„Funktionale Aquivalente" oder Analoga der konkret offenbarten Polypeptide sind im Rahmen 
der vorliegenden Erfindung davon verschiedene Polypeptide, welche weiterhin die gewunschte 
biologische Aktivitat, wie z.B. Substratspezifitat, besitzen. 

20 Unter "funktionalen Aquivalenten" versteht man erfindungsgemali insbesondere Mutanten, wel- 
che in wenigstens einer der oben genannten Sequenzpositionen eine andere als die konkret 
genannte Aminosaure aufweisen aber trotzdem eine der oben genannten biologische Aktivitat 
besitzen. "Funktionale Aquivalente" umfassen somit die durch eine oder mehrere Aminosaure- 
Additionen, -Substitutionen, -Deletionen und/oder-lnversionen erhaltlichen Mutanten, wobei die 
25 genannten Veranderungen in jeglicher Sequenzposition auftreten konnen, solange sie zu einer 
Mutante mitdem erfindungsgemafien Eigenschaftsprofilfuhren. Funktionale Aquivalenzist ins- 
besondere auch dann gegeben, wenn die Reaktivitatsmuster zwischen Mutante und unverander- 
tem Polypeptid qualitativ ubereinstimmen, d.h. beispielsweise gleiche Substrate mit unterschied- 
licher Geschwindigkeit umgesetzt werden. 



t 



30 



35 



"Funktionale Aquivalente" umfassen naturlich auch Polypeptide welche aus anderen Organis- 
men zuganglich sind, sowie naturlich vorkommende Varianten. Beispielsweise lassen sich durch 
Sequenzvergleich Bereiche homologer Sequenzregionen festlegen und in Anlehnung an die 
konkreten Vorgaben der Erfindung aquivalente Enzyme ermitteln. 

„Funktionale Aquivalente" umfassen ebenfalls Fragmente, vorzugsweise einzelne Domanen o- 
der Sequenzmotive, der erfindungsgemafien Polypeptide, welche z.B. die gewunschte biologi- 
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sche Funktion aufweisen. 



„Funktionale Aquivalente" sind aulierdem Fusionsproteine, welche ein deroben genannten Po- 
lypeptidsequenzen oder davon abgeleitete funktionale Aquivalente und wenigstens eine weitere, 
davon funktionell verschiedene, heteroioge Sequenz in funktioneller N- oder C-terminaler Ver- 
knupfung (d.h. ohne gegenseitigen wesentliche funktionelle Beeintrachtigung derFusionsprote- 
inteile) aufweisen. Nichtlimitiernde Beispiele fQr derartige heteroioge Sequenzen sind z.B. Sig- 
nalpeptide, Enzyme, Immunoglobuline, Oberflachenantigene, Rezeptoren oder Rezeptorligan- 
den. 

ErfindungsgemaR mit umfasste „funktiona!e Aquivalente" sind Homologe zu den konkretoffen- 
barten Proteinen. Diese besitzen wenigstens 30%, oderetwa 40%, 50 %, vorzugsweise wenigs- 
tens etwa 60 %, 65%, 70%, oder 75% ins besondere wenigsten 85 %, wie z.B. 90%, 95% oder 
99%, Homologie zu einerder konkret offenbarten Sequenzen, berechnet nach dem Algorithmus 
von Pearson und Lipman, Proc. Natl. Acad, Sci. (USA) 85(8), 1988, 2444-2448. 



Homologe der erfindungsgemalien Proteine oder Polypeptide kSnnen durch Mutagenese er- 
zeugt werden, z.B. durch Punktmutation oder VerkOrzung des Proteins. Der Begriff "Homolog", 
wie er hier verwendet wird, betrifft eine variante Form des Proteins, die als Agonist o- 
20 der Antagonist der Protein-Aktivitat wirkt. 

Homologe des erfindungsgemalien Proteine konnen durch Screening kombinatorischer Banken 
von Mutanten, wie z.B. VerkOrzungsmutanten, identifiziert werden. Beispielsweise kann eine 
variegierte Bank von Protein-Varianten durch kombinatorische Mutagenese auf Nukleinsaure- 
25 ebene erzeugt werden, wie z.B. durch enzymatisches Ligieren eines Gemisches synthetischer 
Oligonukleotide. Es gibt eine Vielzahl von Verfahren, die zur Herstellung von Banken potentieller 
Homologer aus einer degenerierten Oligonukleotidsequenz verwendet werden konnen. Die 
chemische Synthese einer degenerierten Gensequenz kann in einem DNA-Syntheseautomaten 
durchgefQhrt werden, und das synthetische Gen kann dann in einen geeigneten Expressions- 
30 vektor ligiert werden. Die Verwendung eines degenerierten Gensatzes ermoglicht die Bereitstel- 
lung samtlicher Sequenzen in einem Gemisch, die den gewQnschten Satzan potentiellen Prote- 
insequenzen codieren. Verfahren zur Synthese degenerierter Oligonukleotide sind dem Fach- 
mann bekannt (Z.B. Narang, S.A. (1983) Tetrahedron 39:3; Itakura etal. (1984) Annu. Rev. Bio- 
chem. 53:323; Itakura et a!., (1984) Science 198:1056; Ike et al. (1983) Nucleic Acids Res. 
35 11:477). 
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Zusatzlich konnen Banken von Fragmenten des Protein-Codons verwendet werden, um eine 
variegierte Population von Protein-Fragmenten zum Screening und zur anschlielienden Selekti- 
on von Homologen eines erfindungsgemalJen Proteins zu erzeugen. Bei einer Ausfuhrungsform 
kann eine Bank von kodierenden Sequenzfragmenten durch Behandeln eines doppelstrangigen 
PCR-Fragmentes einer kodierenden Sequenzmit einer Nuklease unter Bedingungen, unter de- 
nen ein Nicking nur etwa einmal pro Molekiil erfolgt, Denaturieren der doppelstrangigen DNA, 
Renaturieren der DNA unter Bildung doppelstrangiger DNA, die Sense-/Antisense-Paare von 
verschiedenen genickten Produkten umfassen kann, Entfernen einzelstrangigerAbschnitteaus 
neu gebildeten Duplices durch Behandiung mit S1-Nuclease und Ligieren der resultierenden 
Fragmentbank in einen Expressionsvektor erzeugt werden. Durch dieses Verfahren kann eine 
Expressionsbank hergeleitet werden, die N-terminaie, C-terminale und interne Fragmente mit 
verschiedenen Grofien des erfidungsgemaflen Proteins kodiert. 

Im Stand der Technik sind mehrere Techniken zum Screening von Genprodukten kombinatori- 
scher Banken, die durch Punktmutationen oder VerkQrzung hergestellt worden sind, und zum 
Screening von cDNA-Banken auf Genprodukte mit einer ausgewahlten Eigenschaft bekannt. 
Diese Techniken lassen sich an das schnelle Screening der Genbanken anpassen, die durch 
kombinatorische Mutagenese von erfindungsgemafterHomologer erzeugt worden sind. Die am 
haufigsten verwendeten Techniken zum Screening grolier Genbanken, die einer Analyse mit 
hohem Durchsatz unterliegen, umfassen das Klonieren der Genbank in replizierbare Expressi- 
onsvektoren, Transformieren der geeigneten Zellen mit der resultierenden Vektorenbank und 
Exprimieren derkombinatorischen Gene unter Bedingungen, unter denen derNachweisderge- 
wunschten Aktivitat die Isolation des Vektors, der das Gen codiert, dessen Produkt nachgewie- 
sen wurde, erleichtert. Recursive-Ensemble-Mutagenese (REM), eine Technik, die die Haufigkeit 
funktioneller Mutanten in den Banken vergrofiert, kann in Kombination mit den Screeningtests 
verwendet werden, um Homologe zu identifizieren (Arkin und Yourvan (1992) PNAS 89:7811- 
7815; Delgrave et al. (1993) Protein Engineering 6(3):327-331 

c) ErfindunqsqemaRe Polvnukleotide 

Gegenstand der Erfindung sind ebenso Nukleinsauresequenzen (einzel- und doppelstrangige 
DNA- und RNA-Sequenzen, wie z.B. cDNA und mRNA), kodierend fur eines der obigen metY- 
Enzyme und deren funktionalen Aquivalenten, welche z.B. auch unter Verwendung kQnstlicher 
Nukleotidanaloga zuganglich sind. 

Die Erfindung betrifft sowohl isolierte Nukleinsauremolekule, welche fur erfindungsgemaRe Po- 
lypeptide bzw. Proteine oder biologisch aktive Abschnitte davon kodieren, sowie Nukleinsaure- 
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fragmente, die z.B. zur Verwendung als Hybridisierungssonden oder Primer zur Identifizierung 
oder Amplifizierung von erflndungsgemaderkodierenden Nukleinsauren verwendetwerden kon- 
nen. 

5 Die erfindungsgemafcen NukleinsauremoIekQIe konnen zudem untranslatierte Sequenzen vom 
3'- und/oder 5-Ende des kodierenden Genbereichs enthalten 

Ein "isoliertes" Nukleinsauremolekul wird von anderen Nukleinsauremolekulen abgetrennt, die in 
der naturlichen Quelle der Nukleinsaure zugegen sind und kann uberdies im wesentlichen frei 
1 0 von anderem zellularen Material oder Kulturnnedium sein, wenn es durch rekombinante Techni- 
ken hergestellt wird, oder frei von chemischen Vorstufen oder anderen Chemikalien sein, wenn 
es chemisch synthetisiert wird. 

^j^^ Die Erfindung umfasst weiterhin die zu den konkret beschriebenen Nukleotidsequenzen kom- 
1 5 plementaren NukleinsauremoIekQIe oder einen Abschnitt davon. 

Die erfindungsgemalJ Nukleotidsequenzen ermoglichen die Erzeugung von Sonden und Pri- 
mern, die zur Identifizierung und/oder Klonierung von homologer Sequenzen in anderen Zellty- 
pen und Organismen verwendbarsind. Solche Sonden bzw. Primer umfassen gewohnlich einen 
20 Nukleotidsequenzbereich, der unter stringenten Bedingungen an mindestens etwa 12, vorzugs- 
weise mindestens etwa 25, wie z.B. etwa 40, 50 oder 75 aufeinanderfolgende Nukleotide eines 
Sense-Stranges einer erfindungsgemaiien Nukleinsauresequenz oder eines entsprechenden 
Antisense-Stranges hybridisiert. 

25 Weitere erfindungsgemafJe Nukleinsauresequenzen sind abgeleitet von SEQ ID NO:1 , 3, 5, 7, 9, 

• 1 1 , 1 3, 1 5, 1 7, 1 9, 21 , 23, 25, 27, 29, 31 , 33, 35, 37, 39, 41 , 43, 45, 47, 49, 51 oder 53 und unter- 
scheiden sich davon durch Addition, Substitution, Insertion oder Deletion einzelneroder mehre- 
rer Nukleotide, kodieren aber weiterhin fur Polypeptide mitdem gewunschten Eigenschaftsprofil. 
Dies konnen Polynukleotide sein, die zu obigen Sequenzen in mindestens etwa 50%, 55%, 
30 60%, 65%, 70%, 80% oder 90%, vorzugsweise in mindestens etwa 95%, 96%, 97%, 98% oder 
99% der Sequenzpositionen identisch sind. 

Erfindungsgemafi umfasst sind auch solche Nukleinsauresequenzen, die sogenannte stumme 
Mutationen umfassen oder entsprechend der Codon-Nutzung eins speziellen Ursprungs- oder 
35 Wirtsorganismus, im Veryleich zu einer konkret genannten Sequenz verandert sind, ebenso wie 
naturlich vorkommende Varianten, wie z.B. Spleidvarianten oder Allelvarianten, davon. Gegens- 
tand sind ebenso durch konservative Nukleotidsubstutionen (d.h. die betreffende Aminosaure 
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wird durch eine Aminosaure gleicher Ladung, Grofle, Polaritat und/oder Loslichkeit ersetzt) er- 
haltliche Sequenzen. 



Gegenstand der Erflndung sind auch die durch Sequenzpolymorphismen von den konkret offen- 
barten Nukleinsauren abgeleiteten MolekQIe. Diese genetischen Polymorphismen konnen zwi- 
schen Individuen innerhalb einer Population aufgrund der naturlichen Variation existieren. Diese 
natOrlichen Variationen bewirken ublicherweise eine Varianz von 1 bis 5 % in der Nukleotidse- 
quenz eines Gens. 

Weiterhin umfasst die Erfindung auch Nukleinsauresequenzen, welchen mit oben genannten 
kodierenden Sequenzen hybridisieren oderdazu komplementarsind. Diese Polynukleotide ias- 
sen sich bei Durchmusterung von genomischen oder cDNA-Banken auffinden und gegebenen- 
falls daraus mit geeigneten Primern mittels PCR vermehren und anschlieftend beispielsweise 
mitgeeigneten Sonden isolieren. Eineweitere Moglichkeit bietetdie Transformation geeigneter 
Mikroorganismen mit erfindungsgemalien Polynukleotiden oderVektoren, die Vermehrung der 
Mikroorganismen und damit der Polynukleotide und deren anschlieliende Isolierung. Daruber 
hinaus konnen erfindungsgemafSe Polynukleotide auch auf chemischem Wege synthetisiert 
werden. 

Unter der Eigenschaft, an Polynukleotide „hybridisieren" zu konnen, versteht man die FShigkeit 
eines Poly- oder Oligonukleotids unter stringenten Bedingungen an eine nahezu komplementare 
Sequenz zu binden, wahrend unter diesen Bedingungen unspezifische Bindungen zwischen 
nicht-komplementaren Partnern unterbleiben. Dazu sollten die Sequenzen zu 70-100%, vor- 
zugsweise zu 90-100%, komplementarsein. Die Eigenschaft komplementarer Sequenzen, spe- 
zifisch aneinander binden zu konnen, macht man sich beispielsweise in der Northern- oder Sou- 
thern-Biot-Technik oder bei der Primerbindung in PCR oder RT-PCR zunutze. Oblicherweise 
werden dazu Oligonukleotide ab einer Lange von 30 Basenpaaren eingesetzt Unter stringenten 
Bedingungen versteht man beispielsweise in der Northern-Blot-Technik die Verwendung einer 
50 - 70 °C, vorzugsweise 60 - 65 °C warmen Waschlosung, beispielsweise 0,1x SSC-Puffer mit 
0,1% SDS (20x SSC: 3M NaCI, 0,3M Na-Citrat, pH 7,0) zur Elution unspezifisch hybridisierter 
cDNA-Sonden oder Oligonukleotide. Dabei bleiben, wie oben erwahnt, nur in hohem Made 
komplementare Nukleinsauren aneinander gebunden. Die Einstellung stringenter Bedingungen 
istdem Fachmann bekannt und istz:B. in Ausubel et al., Current Protocols in Molecular Biology, 
John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6. beschrieben. 



c) Isolierung der kodierenden metY-Gene 
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Die fOr das Enzym O-Acetyl-Homoserin-Sulfhydrolase kodierenden metY Gene aus den Orga- 
nismen obiger Liste I sind in an sich bekannter Weise isolierbar. 

Zur Isolierung der metY-Gene oder auch anderer Gene der Organismen aus obiger Liste I wird 
5 zunSchst eine Genbank dieses Organsimus in Escherichia coli (E. coli) angelegt. Das Anlegen 
von Genbanken ist in allgemein bekannten Lehrbuchem und HandbOchern ausfuhrlich beschrie- 
ben. Als Beispiel seien das Lehrbuch von Winnacker: Gene und Klone, Eine Einfuhrung in die 
Gentechnologie (Veriag Chemie, Weinheim, Deutschland, 1990), oder das Handbuch von 
Sambrook et aL: Molecular Cloning, A Laboratory Manual (Cold Spring Harbor Laboratory Press, 
10 1 989) genannt. Eine sehr bekannte Genbank ist die des E. coli K-1 2 Stammes W31 1 0, die von 
Kohara et al. (Cell50, 495-508 (198)) in X-Vektoren angelegt wurde. 

Zur Herstellung einer Genbank von Organismen der Liste I in E. coli konnen Cosmide, wie der 
Cosmidvektor SuperCos I (Wahl et aL, 1987, Proceedings of the National Academy of Sciences 
~15 USA, 84: 2160-2164), aber auch Plasmide, wie pBR322 (BoliVal; Life Sciences, 25, 807-818 
(1979)) oder pUC9 (Vieira et aL, 1 982, Gene, 19: 259-268), verwendetwerden. Ais Wirte eignen 
sich besonders solche E. coli Stamme, die restriktions- und rekombinationsdefekt sind. Ein Bei- 
spiel hierfur ist der Stamm DHSamcr, der von Grant et al. (Proceedings of the National Academy 
of Sciences USA, 87 (1 990) 4645-4649) beschrieben wurde. Die mit Hilfe von Cosmiden klonier- 
20 ten langen DN A-Fragmente konnen anschlieliend wiederum in gangige, fur die Sequenzierung 
geeignete Vektoren subkloniert und anschlieliend sequenziert werden, so wie es z. B. bei San- 
ger et al. (proceedings of the National Academy of Sciences of the United States of America, 74: 
5463-5467, 1977) beschrieben ist 



#Die erhaltenen DNA-Sequenzen konnen dann mit bekannten Algorithmen bzw. Sequenzanalyse- 
Programmen, wie z. B. dem von Staden (Nucleic Acids Research 14,217-232(1986)), dem von 
Marck (Nucleic Acids Research 16, 1829-1836 (1988)) oder dem GCG-Programm von Butler 
(Methods ofBiochemical Analysis 39, 74-97 (1998)), untersucht werden. 

30 Die fur die metY-Gene kodierenden DNA-Sequenzen von Organismen gemali obiger Liste I 
wurde gefunden. Insbesondere wurden DNA-Sequenzen gemali gemali SEQ ID NO:1, 3, 5, 7, 
9, 1 1, 13, 15, 17, 19, 21 , 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51 und 53. Wei- 
terhin wurde aus diesen vorliegenden DNA-Sequenzen mit den oben beschriebenen Methoden 
die Aminosauresequenze'n derentsprechenden Proteine abgeleitet. Durch SEQ ID NO:2, 4, 6, 8, 

35 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 und 54 sind 
die sich ergebenden Aminosauresequenzen der metY Genprodukte dargestellt. 
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Kodierende DNA-Sequenzen, die sich aus den Sequenzen gemafJ SEQ ID NO:1, 3, 5, 7, 9, 1 1 , 
13, 15, 17, 19, 21, 23, 25, 27, 29, 31 , 33, 35, 37, 39, 41, 43, 45, 47, 49, 51 und 53 durch die De- 
generation des genetischen Kodes ergeben, sind ebenfalls Gegenstand der Erfindung. In glei- 
cher Weise sind DNA-Sequenzen, die mitdiesen Sequenzen oder davon abgeleiteten Sequenz- 
teilen hybridisieren, Gegenstand der Erfindung. 



Anleitungen zur Identifizierung von DNA-Sequenzen mittels Hybridisierung findetder Fachmann 
unter anderem im Handbuch 'The DIG System Users Guide fur Filter Hybridization" der Ftrma 
Boehringer Mannheim GmbH (Mannheim, Deutschland, 1993) und bei Liebl etal. (International 
Journal of Systematic Bacteriology (1 991 ) 41 : 255-260). Anleitungen zur Amplifikation von DNA- 
Sequenzen mit Hilfe der Polymerase-Kettenreaktion (PCR) findet der Fachmann unter anderem 
im Handbuch von Gait: Oligonukleotide synthesis: A Practical Approach (IRL Press, Ox- ford, 
UK, 1984) und bei Newton und Graham: PCR (Spektrum Akademischer Verlag, Heidelberg, 
Deutschland, 1994). 

Weiterhin ist bekannt, dass Anderungen am N- und/oder C- Terminus eines Proteins dessen 
Funktion nicht wesentlich beeintrachtigen oder sogar stabilisieren konnen. Angaben hierzu findet 
der Fachmann unter anderem bei Ben-Bassat et al. (Journal of Bacteriology 169: 751-757 
20 (1 987)), bei O'Regan et al. (Gene 77: 237-251 (1 989), bei Sahin-Toth et al. (Protein Sciences 3: 
240-247 (1994)), bei Hochuli et al. (Biontechnology 6: 1321-1325 (1988)) und in bekannten 
LehrbQchern der Genetik und Molekularbiologie. 




Aminosauresequenzen, die sich in entsprechender Weise aus den SEQ ID NO:2,4, 6, 8, 10, 12, 
25 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 und 54 ergeben, sind 
ebenfalls Bestandteil der Erfindung. 

d) ErfindungsgemaR verwendete Wirtszellen 



30 Weitere Gegenstande der Erfindung betreffen als Wirtszelle dienende Mikroorgansismen, insbe- 
sondere coryneforme Bakterien, die einen Vektor, insbesondere Pendelvektor oder Plasmidvek- 
tor, der wenigstens ein metY Gen gerfindungsgemafJer Definition tragt, enthalten oder in denen 
ein erfindungsgemafies metY Gen exprimiert bzw. verstarkt ist. 



35 Diese Mikroorganismen konnen schwefelhaltige Feinchemikalien, insbesondere L-Methionin, 
aus Glucose, Saccharose, Lactose, Fructose, Maltose, Melasse, Starke, Cellulose oder aus Gly- 
cerin und Ethanol herstellen. Vorzugsweise sind dies coryneforme Bakterien, insbesondere der 
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Gattung Corynebacterium. Aus der Gattung Corynebacterium ist insbesondere die Art Coryne- 
bacterium glutamicum zu nennen, die in der Fachwelt fur ihre Fahigkeit bekannt ist, L- 
Aminosauren zu produzieren. 

5 Als Beispiele fur geeignete Stamme coryneformer Bakterien sind solche der Gattung 
Corynebacterium, insbesondere der Art Corynebacterium glutamicum (C. glutamicum), wie 
Corynebacterium glutamicum ATCC 13032, 
Corynebacterium acetoglutamicum ATCC 15806, 
Corynebacterium acetoacidophilum ATCC 13870, 
10 Corynebacterium thermoaminogenes FERM BP-1539, 
Corynebacterium melassecola ATCC 17965 

toder 
der Gattung Brevibacterium, wie 
Brevibacterium flavum ATCC 14067 
Brevibacterium lactofermentum ATCC 13869 und 
Brevibacterium divaricatum ATCC 14020 zu nennen; 
oder davon abgeleitete Stamme, wie 
Corynebacterium glutamicum KFCC10065 
20 Corynebacterium glutamicum ATCC21 608 

welche ebenfalls die gewGnschte Feinchemikalie oder deren Vorstufe(n) produzieren. 
Mitder AbkQrzung KFCC ist die Korean Federation of Culture Collection gemeint, mitder Abkur- 
zung ATCC die American type strain culture collection, mit der Abkurzung 

25 

e) Durchfuhrung der erfindungsgemaften Fermentation 

Erfindungsgemafi wurde festgestellt, dass coryneforme Bakterien nach Oberexpression eines 
metY Gens aus Organismen der Liste I in vorteilhafter Weise schwefelhaltige Feinchemikalien, 
30 insbesondere L-Methionin, produzieren. 

Zur Erzielung einer Oberexpression kann der Fachmann unterschiedliche Malinahmen einzeln 
oder in Kombination ergreifen. So kann die Kopienzahl der entsprechenden Gene erhoht wer- 
den, oderes kann die Promoter- und Regulationsregion oder die Ribosomenbindungsstelle, die 
35 sich stromaufwarts des Strukturgens befindet, mutiert werden. In gleicher Weise wirken Expres- 
sionskassetten, die stromaufw§rts des Strukturgens eingebaut werden. Durch induzierbare Pro- 
motoren ist es zusatzlich moglich, die Expression im Verlaufe der fermentativen L-Methionin- 
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Produktion zu steigern. Durch Mallnahmen zur Verlangerung der Lebensdauerder mRNA wird 
ebenfalls die Expression verbessert. Weiterhin wird durch Verhinderung des Abbaus des En- 
zymproteins ebenfalls die Enzymaktivitat verstarkt. Die Gene oder Genkonstrukte k6nnen ent- 
weder in Plasmiden mit unterschiedlicher Kopienzahl vorliegen oder im Chromosom integriert 
und amplifiziert sein. Alternativ kann weiterhin eine Oberexpression der betreffenden Gene 
durch Veranderung der Medienzusammensetzung und KulturfGhrung erreicht werden. 

Anleitungen hierzu findetderFachmann unteranderem bei Martin etal. (Biontechnology 5, 137- 
146 (1987)), bei Guerrero et al. (Gene 138, 35-41 (1994)), Tsuchiya und Morinaga 
(Bio/Technology 6, 428-430 (1988)), bei Eikmanns etal. (Gene 102, 93-98 (1991)), in der Euro- 
paischen Patentschrift 0472869, im US Patent 4, 60 1,893, bei Schwarzerund PQhler (Biotechno- 
logy 9, 84-87 (1991), bei Remscheid etal. (Applied and Environmental Microbiology 60, 126-1 32 
(1994), bei LaBarre et al. (Journal of Bacteriology 175, 1001-1007 (1993)), in der Patentanmel- 
dung WO 96/15246, bei Malumbres etal. (Gene 134, 15-24 (1993)), in derjapanischen Offenle- 
gungsschrift J P-A- 10-229891, bei Jensen und Hammer (Biotechnology and Bioengineering 
58,. 191 -195 (1 998)), bei Makrides (Microbiological Reviews 60 : 512-538 (1996) und in bekann- 
ten LehrbQchem der Genetik und Molekularbiologie. 

Gegenstand der Erfindung sind deshalb auch Expressionskonstrukte, enthaltend unterderge- 
netischen Kontrolle regulativerNukleinsauresequenzen einefOr ein erfindungsgemafJes Poly- 
peptid kodierende Nukleinsauresequenz; sowie Vektoren, umfassend wenigstens eines dieser 
Expressionskonstrukte. Vorzugsweise umfassen solche erfindungsgemafcen Konstrukte 5'- 
stromaufwarts von der jeweiligen kodierenden Sequenz einen Promotor und 3-stromabwarts 
eine Terminatorsequenz sowie gegebenenfalls weitere ubliche regulative Elemente, und zwar 
jeweils operativ verknOpft mit der kodierenden Sequenz. Unter einer „operativen VerknOpfung" 
versteht man die sequentielle Anordnung von Promotor, kodierender Sequenz, Terminator und 
gegebenenfalls weiterer regulativer Elemente derart, dass jedes der regulativen Elemente seine 
Funktion bei der Expression der kodierenden Sequenz bestimmungsgemafi erfCillen kann. Bei- 
spiele for operativ verknQpfbare Sequenzen sind Aktivrieungssequenzen sowie Enhancer und 
dergleichen. Weitere regulative Elemente umfassen selektierbare Marker, Amplifikationssignale, 
Replikationsursprunge und dergleichen. Geeignete regulatorische Sequenzen sind z.B. be- 
schrieben in Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic 
Press, San Diego, CA (1990). 

Zusatzlich zu den artifiziellen Regulationssequenzen kann die natOrliche Regulationssequenz 
vor dem eigentlichen Strukturgen noch vorhanden sein. Durch genetische Veranderung kann 
diese naturliche Regulation gegebenenfalls ausgeschaltet und die Expression der Gene erhoht 
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oder erniedrigt werden. Das Genkonstrukt kann aberauch einfacheraufgebaut sein, das heilit 
es werden keine zusatzlichen Regulationssignale vor das Strukturgen insertiert und der natOrli- 
che Promoter mit seiner Regulation wird nicht entfernt Statt dessen wird die naturliche Regulati- 
onssequenz so mutiert, dass keine Regulation mehr erfolgt und die Genexpression gesteigert 
oder verringert wird. Die Nukleinsauresequenzen konnen in einer oder mehreren Kopien im Gen- 
konstrukt enthalten sein. 



Beispiele fur brauchbare Promotoren sind: die Promotoren, ddh, amy, lysC, dapA, lysA aus Co- 
rynebacterium glutamicum, aberauch gram-positiven Promotoren SP02 wie sie in Bacillus Sub- 
1 0 tilis and Its Closest Relatives, Sonenshein, Abraham L,Hoch, James A., Losick, Richard; ASM 
Press, District of Columbia, Washington und Patek M. Eikmanns BJ. Patek J. Sahm H. Microbio- 
logy. 142 1297-309, 1996 beschrieben sind, oder aberauch cos-, tac-, trp-, tet- f trp-tet- f Ipp-, lac- 

t, Ipp-lac-, laclq-, T7-, T5-, T3-, gal-, trc-, ara-, SP6-, l-PR- oder im l-PL-Promotor, die vorteilhaft- 
erweise in gram-negativen Bakterien Anwendung finden. Bevorzugt ist auch die Verwendung 
induzierbarer Promotoren, wie z.B. licht- und insbesondere temperaturinduztierbarer Promoto- 
ren, wie der P r P r Promotor. Prinzipiell konnen alle naturlichen Promotoren mit ihren Regulations- 
sequenzen verwendet werden. Dartiber hinaus konnen auch synthetische Promotoren vorteilhaft 
verwendet werden. 

20 Die genannten regulatorischen Sequenzen sollen die gezielte Expression der Nukleinsaurese- 
quenzen und der Proteinexpression ermoglichen. Dies kann beispielsweise je nach Wirtsorga- 
nismus bedeuten, dass das Gen erst nach Induktion exprimiert oder Qberexprimiert wird, oder 
dass es sofort exprimiert und/oder Qberexprimiert wird. 

25 Die regulatorischen Sequenzen bzw. Faktoren konnen dabei vorzugsweise die Expression posi- 
tiv beeinflussen und dadurch erhohen oderemiedrigen. So kann eine Verstarkung der regulato- 
rischen Elemente vorteilhafterweise auf der Transkriptionsebene erfolgen, indem starke 
Transkriptionssignale wie Promotoren und/oder "Enhancer" verwendet werden. Daneben istaber 
auch eine Verstarkung der Translation moglich, indem beispielsweise die Stabilitat der mRNA 
30 verbessert wird. 

Die Herstellung einer Expressionskassette erfolgt durch Fusion eines geeigneten Promoters, 
einergeeigneten Shine-Dalgarnow-Sequenz mit einer metY-Nukleotidsequenzsowie einem ge- 
eigneten Terminationssignal. Dazu verwendet man gangige Rekombinations- und Klonie- 
35 rungstechniken, wie sie beispielsweise in Current Protocols in Molecular Biology, 1993, John 
Wiley & Sons, Incorporated, New York New York, PCR Methods, Gelfand, David H., Innis, Mi- 
chael A., Sninsky, John J. 1999, Academic Press* Incorporated, California, San Diego, ., PCR 
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Cloning Protocols, Methods in Molecular Biology Ser., Vol. 192, 2nd ed., Humana Press, New 
Jersey, Totowa. T. Maniatis, E.F. Fritsch und J. Sambrook, Molecular Cloning: A Laboratory Ma- 
nual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989) sowie in T.J. Silhavy, M.L 
Berman und L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, 
5 Cold Spring Harbor, NY (1 984) und in Ausubel, F.M. et al., Current Protocols in Molecular Biolo- 
gy, Greene Publishing Assoc. and Wiley Interscience (1987) beschrieben sind. 

Das rekombinante Nukleinsaurekonstrukt bzw. Genkonstrukt wird zur Expression in einem ge- 
eigneten Wirtsorganismus vorteilhafterweise in einen wirtsspezifischen Vektor insertiert, der eine 
1 0 optimale Expression der Gene im Wirt ermoglicht. Vektoren sind dem Fachmann wohl bekannt 
und konnen beispielsweise aus "Cloning Vectors' 1 (Pouwels P. H. et al., Hrsg, Elsevier, Amster- 
dam-New York-Oxford, 1985) entribmmen werden. Unter Vektoren sind aufier Plasmiden auch 
alle anderen dem Fachmann bekannten Vektoren, wie beispielsweise Phagen, Transposons, IS- 
Elemente, Phasmide, Cosmide, und lineare oder zirkulare DNAzu verstehen. Diese Vektoren 
T5 konnen autonom im Wirtsorganismus repliziert oder chromosomal repliziert werden. 

Zur Verstarkung wurden erfindungsgemafle metY Gene beispielhaft mit Hilfe von episomalen 
Plasmiden uberexprimiert. Als Plasmide eignen sich solche, die in coryneformen Bakterien repli- 
ziert werden. Zahlreiche bekannte Plasmidvektoren, wie z. B. pZ1 (Menkel et al., Applied and 
20 Environmental Microbiology (1989) 64: 549-554), pEKExl (Eikmanns et al., Gene 102: 93-98 
(1991)) oder pHS2-1 (Sonnen et al., Gene 107: 69-74 (1991)) beruhen auf den kryptischen 
Plasmiden pHM1519, pBL1 oder pGA1 . Andere Plasmidvektoren, wie z. B. pCLiK5MCS, Oder 
solche, die auf pCG4 (US-A 4,489,160) oder pNG2 (Serwold-Davis et al., FEMS Microbiology 
Letters 66, 119-124 (1990)) oder pAG1 (US-A 5,158,891) beruhen, konnen in gleicher Weise 
verwendet werden. 




Weiterhin eignen sich auch solche Plasmidvektoren mit Hilfe derer man das Verfahren der Ge- 
namplifikation durch Integration in das Chromosom anwenden kann, sowie es beispielsweise 
von Remscheid et al. (Applied and Environmental Microbiology 60,126-132 (1994)) zur Duplika- 
30 tion bzw. Amplifikation des hom-thrB-Operons beschrieben wurde. Bei dieser Methode wird das 
vollstandige Gen in einen Plasmidvektor kloniert, der in einem Wirt (typischerweise E. coli), nicht 
aberin C. glutamicum replizieren kann. Als Vektoren kommen beispielsweise pSUP301 (Simon 
et al., Bio/ Technology 1,784-791 (1983)), pK18mob oder pK19mob (Schafer et al., Gene 
145,69-73 (1994)), Bernard et al., Journal ofMolecular Biology, 234: 534-541 (1993)), pEM1 
35 (Schrumpf etal. 1991, Journal of Bacteriology 173: 4510-4516) oder pBGS8 (Sprattetal.,1986, 
Gene 41: 337-342) in Frage. Der Plasmidvektor, der das zu amplifizierende Gen enthalt, wird 
anschlieliend durch Transformation in den gewunschten Stamm von C. glutamicum uberfuhrt. 
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Methoden zur Transformation sind beispielsweise bei Thierbach et al. (Applied Microbiology and 
Biotechnology 29, 356-362 (1988)), Dunican und Shivnan (Biotechnology 7, 1067-1070 (1989)) 
und Tauch et al. (FEMS Microbiological Letters 123,343-347 (1994)) beschrieben. 

5 Enzyme konnen durch Mutationen in den korrespondierenden Genen derart in ihrer Aktivltat 
beeinfluftt werden, dass es zu einer teilweisen oder vollstandigen Verringerung der Reaktions- 
geschwindigkeit der enzymatischen Reaktion kommt. Beispiele fOrsolche Mutationen sind dem 
Fachmann bekannt (Motoyama H. Yano H. Terasaki Y. Anazawa H. Applied & Environmental 
Microbiology. 67:3064-70, 2001 , Eikmanns BJ. Eggeling L. Sahm H. Antonie van Leeuwenhoek. 
10 64:145-63, 1993-94.) 
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Zusatzlich kann es fur die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, neben einer Expression bzw. Verstarkung eines erfindungsgemaften 
metY-Gen eines oder mehrere Enzyme des jeweiligen Biosyntheseweges, des Cystein- 
Stoffwechselwegs, der Apratatsemialdehyd-Synthese, der Glykolyse, der Anaplerotik, des Pen- 
tose-Phosphat-Stoffwechsels, des Zitronensaure-Zyklus oder des Aminosaure-Exports zu 
verstarken. 



So kann fur die Herstellung von schwefelhaltige Feinchemikalien, insbesondere L-Methionin, 
20 eines oder mehrere der folgenden Gene verstarkt sein: 

- das for eine Aspartatkinase kodierende Gen lysC (EP 1 108 790 A2; DNA-SEQ NO. 281), 
-das for eine Aspartat-Semialdehyd kodierende Gen asd (EP 1 108 790 A2; DNA-SEQ NO. 
282), 

- das fQr die Glycerinaldehyd-3-Phosphat Dehydrogenase kodierende Gen gap (Eikmanns 
25 (1 992), Journal of Bacteriology 1 74: 6076-6086), 

MM - das fOr die 3-Phosphoglycerat Kinase kodierende Gen pgk (Eikmanns (1992), Journal of 
Bacteriology 174: 6076-6086), 

- das fQr die Pyruvat Carboxylase kodierende Gen pyc (Eikmanns (1 992), Journal of Bacteriology 
174: 6076-6086), 

30 - das fur die Triosephosphat Isomerase kodierende Gen tpi (Eikmanns (1 992), Journal of Bacte- 
riology 174: 6076-6086), 

- das fUr die Homoserin O-Acetyltransferase kodierende Gen metA (EP 1 1 08 790 A2; DNA-SEQ 
NO. 725), 

- das fur die Cystahionin-gamma-Synthase kodierende Gen metB (EP 1 108 790 A2; DNA-SEQ 
35 NO. 3491), 

- das fur die Cystahionin-gamma-Lyase kodierende Gen metC (EP 1 1 08 790 A2; DNA-SEQ NO. 
3061), 
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- das fOr die Serin-Hydroxymethyltransferase kodierende Gen glyA (EP 1 1 08 790 A2; DNA-SEQ 
NO. 1110), 

- das fOr die MethioninSynthase kodierende Gen metH (EP 1 108 790 A2), 

- das fOr die Methylentetrahydrofolat-Reduktase kodierende Gen metF (EP 1 108 790 A2; DNA- 
SEQ NO. 2379), 

- das fOr die Phosphoserin-Aminotransferase kodierende Gen serC (EP 1 108 790 A2; DNA- 
SEQ NO. 928) 

- eines fOr die Phosphoserin-Phosphatase kodierende Gen serB (EP 1 108 790 A2; DNA-SEQ 
NO. 334, DNA-SEQ NO. 467, DNA-SEQ NO. 2767) 

- das fOr die Serine Acetyl-Transferase kodierende Gen cysE (EP 1 108 790 A2; DNA-SEQ NO. 
2818) 

- das fur eine Homoserin-Dehydrogenase kodierende Gen horn (EP 1 108 790 A2; DNA-SEQ 
NO. 1306) 

So kann fur die Herstellung von schwefelhaltige Feinchemikalien, insbesondere L-Methionin in 
coryneformen Bakterien, vorteilhaftsein, gleichzeitig wenigstens eines dernachfolgenden Gene 
zu mutieren, so dass die korrespondierenden Proteine, verglichen mitnichtmutierten Proteinen, 
in geringerem Made oder nicht durch einen Stoffwechselmetaboliten in ihrer Aktivitat beeinflusst 
werden: 

- das far eine Aspartatkinase kodierende Gen lysC (EP 1 108 790 A2; DNA-SEQ NO. 281), 

- das fOr die Pyruvat Carboxylase kodierende Gen pyc (Eikmanns (1 992), Journal of Bacteriology 
174: 6076-6086), 

- das fOr die Homoserin O-Acetyltransferase kodierende Gen metA (EP 1 108 790 A2; DNA-SEQ 
NO. 725), 

- das f Or die Cystahionin-gamma-Synthase kodierende Gen metB (EP 1 1 08 790 A2; DNA-SEQ 
NO. 3491), 

- das fOr die Cystahionin-gamma-Lyase kodierende Gen metC (EP 1 1 08 790 A2; DNA-SEQ NO. 
3061), 

- das fOr die Serin-Hydroxymethyltransferase kodierende Gen glyA (EP 1 108 790 A2; DNA-SEQ 
NO. 1110), 

- das far die Methionin Synthase kodierende Gen metH (EP 1 108 790 A2), 

- das fOr die Methylentetrahydrofolat-Reduktase kodierende Gen metF (EP 1 108 790 A2; DNA- 
SEQ NO. 2379), 

- das fOr die Phosphoserin-Aminotransferase kodierende Gen serC (EP 1 108 790 A2; DNA- 
SEQ NO. 928) 

- eines fOr die Phosphoserin-Phosphatase kodierende Gen serB (EP 1 108 790 A2; DNA-SEQ 
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NO. 334, DNA-SEQ NO. 467, DNA-SEQ NO. 2767) 

- das fur die Serine Acetyl-Transferase kodierende Gen cysE (EP 1 108 790 A2; DNA-SEQ NO. 
2818) 

- das fur eine Homoserin-Dehydrogenase kodierende Gen horn (EP 1 108 790 A2; DNA-SEQ 
5 NO. 1306) 

Weiterhin kann es fur die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, zusatzlich zur Expression bzw. Verstarkung eines der erfindungsge- 
mafien metY-Gene eines oder mehrere der folgenden Gene abzuschwachen, insbesondere de- 
1 0 ren Expression zu verringem, oder auszuschalten: 



- das fOr die Homoserine-Kinase kodierende Gen thrB (EP 1 108 790 A2; DNA-SEQ NO. 3453) 

#- das fur die Threonin Dehydratase kodierende Gen ilvA (EP 1 108 790 A2; DNA-SEQ NO. 
2328) 
- das fur die Threonin Synthase kodierende Gen thrC (EP 1 108 790 A2; DNA-SEQ NO. 3486) 

- das fur die Mes'o-Diaminopimelat D-Dehydrogenase kodierende Gen ddh (EP 1 108 790 A2; 
DNA-SEQ NO. 3494) 

- das fur die Phosphoenolpyruvat-Carboxykinase kodierende Gen pck (EP 1 108 790 A2; DNA- 
SEQ NO. 3157) 

20 - das fur die Glucose-6-Phosphat-6-lsomerase kodierende Gen pgi (EP 1 108 790 A2; DNA- 
SEQ NO. 950) 

- das fur die Pyruvat-Oxidase kodierende Gen poxB (EP 1 108 790 A2; DNA-SEQ NO. 2873) 

- das fOr die Dihydrodipicolinat Synthase kodiernde Gen dapA(EP 1 1 08 790 A2; DNA-SEQ NO. 
3476) 

25 - das fur die Dihydrodipicolinat Reduktase kodiernde Gen dapB (EP 1 1 08 790 A2; DNA-SEQ 
| | NO. 3477) 

- das fur die Diaminopicolinat Decarboxylase kodiernde Gen lysA (EP 1 1 08 790 A2; DNA-SEQ 
NO. 3451) 



30 Weiterhin kann es fOr die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, zusatzlich zur Expression bzw. Verstarkung eines der erfindungsge- 
mafien metY-Gene in Coryneformen Bakterien gleichzeitig wenigstens eines der folgenden Ge- 
ne so zu mutieren, dass die enzymatische Aktivitat des korrespondierenden Proteins teitweise 
oder vollstandig verringert wird: 

35 

-das fur die Homoserine-Kinase kodierende Gen thrB (EP 1 108 790 A2; DNA-SEQ NO. 3453) 
- das fur die Threonin Dehydratase kodierende Gen ilvA (EP 1 108 790 A2; DNA-SEQ NO. 
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2328) 

- das for die Threonin Synthase kodierende Gen thrC (EP 1 108 790 A2; DNA-SEQ NO. 3486) 

- das fdr die Meso-Diaminopimelat D-Dehydrogenase kodierende Gen ddh (EP 1 108 790 A2; 
DNA-SEQ NO. 3494) 

5 - das fur die Phosphoenolpyruvat-Carboxykinase kodierende Gen pck (EP 1 1 08 790 A2; DNA- 
SEQ NO. 3157) 

- das fQr die Glucose-6-Phosphat-6-lsomerase kodierende Gen pgi (EP 1 108 790 A2; DNA- 
SEQ NO. 950) 

- das fur die Pyruvat-Oxidase kodierende Gen poxB (EP 1 108 790 A2; DNA-SEQ NO. 2873) 
10 - das fur die Dihydrodipicolinat Synthase kodiernde Gen dapA(EP 1 1 08 790 A2; DNA-SEQ NO. 

3476) 

- das fOr die Dihydrodipicolinat Reduktase kodiernde Gen dapB (EP 1 108 790 A2; DNA-SEQ 
NO. 3477) 

- das fur die Diaminopicolinat Decarboxylase kodiernde Gen lysA (EP 1 1 08 790 A2; DNA-SEQ 
NO. 3451) 



t 



Weiterhin kann es fur die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, neben der Expression bzw. Verstarkung eines erfindungsgemaften 
metY-Gens unerwunschte Nebenreaktionen auszuschalten (Nakayama: "Breeding of Amino 
20 Acid Producing Microorganisms", in: Overproduction of Microbial Products, Krumphanzl, Sikyta, 
Vanek (eds.), Academic Press, London, UK, 1982). 

Die erfindungsgemafJ hergestellten Mikroorganismen kbnnen kontinuierlich oderdiskontinuier- 
lich im batch- Verfahren (Satzkultivierung) oderimfed batch (Zulaufverfahren)oder repeated fed 
^25 batch Verfahren (repetitive Zulaufverfahren) zur Produktion von schwefelhaltige Feinchemika- 
lien, insbesondere L-Methionin, kultiviert werden. Eine Zusammenfassung uber bekannte Kulti- 
vierungsmethoden ist im Lehrbuch von Chmiel (BioprozefJtechnik 1 . EinfQhrung in die Bioverfah- 
renstechnik (Gustav Fischer Verlag, Stuttgart, 1 991 )) oder im Lehrbuch von Storhas (Bioreakto- 
ren und periphere Einrichtungen (Vieweg Verlag, Braunschweig/Wiesbaden, 1994)) zu finden. 



30 



35 



Das zu verwendende Kulturmedium hat in geeigneter Weise den Anspruchen der jeweiligen 
Stamme zu genugen. Beschreibungen von Kulturmedien verschiedener Mikroorganismen sind 
im Handbuch "Manual of Methods fur General Bacteriology" der American Society fur Bacterio- 
logy (Washington D. C, USA, 1981) enthalten. 

Diese erfindungsgemali einsetzbaren Medien umfassen gewohnlich eine oder mehrerenKoh- 
lenstoffquellen, Stickstoffquellen, anorganische Salze, Vitamine und/oder Spurenelemente. 
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Bevorzugte Kohlenstoffquellen sind Zucker, wie Mono- Di-oder Polysaccharide. Sehrgute Koh- 
lenstoffquellen sind beispieisweise Glucose, Fructose, Mannose, Galactose, Ribose, Sorbose, 
Ribulose, Lactose, Maltose, Saccharose, Raffinose, Starke oder Cellulose. Man kann Zucker 
auch Qber komplexe Verbindungen, wie Melassen, oder andere Nebenprodukte der Zucker- 
Raffinierung zu den Medien geben. Es kann auch vorteilhaftsein, Gemische verschiedener Koh- 
lenstoffquellen zuzugeben. Andere mogliche Kohlenstoffquellen sind Ole und Fette wie z. B. 
Sojaol. Sonnenblumenol. Erdnufiol und Kokosfett, Fettsauren wie z. B. Palmitinsaure, Stearin- 
saure oder Linolsaure, Alkohole wie z. B. Glycerin, Methanol oder Ethanol und organische Sau- 
ren wie z. B. Essigsaure oder Milchsaure. 

Stickstoffquellen sind gewohnlich organische oder anorganische Stickstoffverbindungen oder 
Materialien, die diese Verbindungen enthalten. Beispielhafte Stickstoffquellen umfassen Ammo- 
niak-Gas oder Ammoniumsalze, wie Ammoniumsulfat, Ammoniumchlorid, Ammoniumphosphat, 
Ammoniumcarbonat oder Ammoniumnitrat, Nitrate, Hamstoff, Aminosauren oder komplexe 
Stickstoffquellen, wie Maisquellwasser, Sojamehl, Sojaprotein, Hefeextrakt, Fleischextrakt und 
andere. Die Stickstoffquellen konnen einzeln oderals Mischung verwendet werden. 

Anorganische Salzverbindungen, die in den Medien enthalten sein konnen, umfassen die Chlo- 
rid-, Phosphor- oder Sulfatsalze von Calcium, Magnesium, Natrium, Kobalt, Moiybdan, Kalium, 
Mangan, Zink, Kupfer und Eisen 

Als Schwefelquelle fur die Herstellung von schwefelhaitigen Feinchemikalien, insbesondere von 
Methionin, konnen anorganische schwefelhaltige Verbindungen wie beispieisweise Sulfate, Sulfi- 
te, Dithionite, Tetrathionate, Thiosulfate, Sulfide aber auch organische Schwefelverbindungen, 
wie Mercaptane und Thiole, verwendet werden. 

Als Phosphorquelle konnen Phosphorsaure, Kaliumdihydrogenphosphat oder Dikaliumhydro- 
genphosphat oder die entsprechenden Natrium haltigen Salze verwendet werden. 

Chelatbildner konnen zum Medium gegeben werden, urn die Metallionen in Losung zu halten. 
Besonders geeignete Chelatbildner umfassen Dihydroxyphenole, wie Catechol oder Protocate- 
chuat, oder organische Sauren, wie Citronensaure. 

Die erfindungsgemaU eingesetzten Fermentationsmedien enthalten iiblicherweise auch andere 
Wachstumsfaktoren, wie Vitamine oder Wachstumsforderer, zu denen beispieisweise Biotin, 
Riboflavin, Thiamin, Folsaure, Nikotinsaure, Panthothenat und Pyridoxin gehoren. Wachstums- 
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faktoren und Salze stammen haufig von komplexen Medienkomponenten, wie Hefeextrakt, Me- 
lassen, Maisquellwasser und dergleichen. Dem Kulturmedium konnen Oberdies geeignete Vor- 
stufen zugesetzt werden. Die genaue Zusammensetzung der Medienverbindungen hangt stark 
vom jeweiligen Experiment ab und wird fur jeden spezifischen Fall individuell entschieden. In- 
formation Ober die Medienoptimierung ist erhaltlich aus dem Lehrbuch "Applied Microbiol. Physi- 
ology, A Practical Approach" (Hrsg. P.M. Rhodes, P.F. Stanbury, IRL Press (1997) S. 53-73, 
ISBN 0 1 9 963577 3). Wachstumsmedien lassen sich auch von kommerziellen Anbietern bezte- 
hen, wie Standard 1 (Merck) oder BHI (Brain heart infusion, DIFCO) und dergleichen. 

Samtliche Medienkomponenten werden, entweder durch Hitze (20 min bei 1 ,5 bar und 1 21 °C) 
oder durch Sterilfiltration, sterilisiert. Die Komponenten konnen entweder zusammen oder noti- 
genfalls getrennt sterilisiert werden. SSmtliche Medienkomponenten konnen zu Beginn der An- 
zucht zugegen sein oder wahlfrei kontinuierlich oder chargenweise hinzugegeben werden. 

Die Temperatur der Kultur liegt normalerweise zwischen 15°C und 45°C, vorzugsweise bei 25°C 
bis 40°C und kann wahrend des Experimentes konstant gehalten oder verandert werden, Der 
pH-Wert des Mediums sollte im Bereich von 5 bis 8,5, vorzugsweise um 7,0 liegen. Der pH-Wert 
fur die Anzucht ISRt sich wahrend der Anzucht durch Zugabe von basische Verbindungen wie 
Natriumhydroxid, Kaliurnhydroxid, Ammoniak bzw. Ammoniakwasser oder saure Verbindungen 
wie Phosphorsaure oder Schwefelsaure kontrollieren. Zur Kontrolle der Schaumentwicklung 
konnen Antischaummitte,! wie z. B. Fettsaurepolyglykolester, eingesetzt werden. Zur Aufrechter- 
haltung der Stabilitat von Plasmiden konnen dem Medium geeignete selektiv wirkende Stoffe, 
wie z. B. Antibiotika, hinzugefugt werden. Um aerobe Bedingungen aufrechtzuerhalten, werden 
Sauerstoff oder Sauerstoff haltige Gasmischungen, wie z. B. Umgebungsluft, in die Kultur einge- 
tragen. Die Temperatur der Kultur liegt normalerweise bei 20°C bis 45°C und. Die Kultur wird 
solange fortgesetzt, bis sich ein Maximum des gewdnschten Produktes gebildet hat. Dieses Ziel 
wird normalerweise innerhalb von 10 Stunden bis 160 Stunden erreicht 

Die so erhaltenen, insbesondere L-Methionin enthaltenden, Fermentationsbriihen haben 
ublicherweise eine Trockenmasse von 7,5 bis 25 Gew.-%. 

Vorteilhaft ist aufierdem auch, wenn die Fermentation zumindest am Ende, insbesondere jedoch 
Qber mindestens 30% der Fermentationsdauer zuckerlimitiert gefahren wird. Das heifit, dass 
wahrend dieser Zeit die Konzentration an verwertbarem Zucker im Fermentationsmedium auf > 0 
bis 3 g/l gehalten, beziehungsweise abgesenkt wird. 
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Die Fermentationsbrtihe wird anschlieftend weiterverarbeitet. Je nach Anforderung kann die 
Biomasse ganz oder teilweise durch Separationsmethoden, wie z. B. Zentrifugation, Filtration, 
Dekantieren oder einer Kombination dieser Methoden aus der Fermentationsbruhe entfernt oder 
vollstandig in ihr belassen werden. 

5 

Anschliefiend kann die Fermentationsbrtihe mit bekannten Methoden, wie z. B. mit Hilfe eines 
Rotationsverdampfers, DQnnschichtverdampfers, Fallfilmverdampfers, durch Umkehrosmose, 
oder durch Nanofiltration, eingedickt beziehungsweise aufkonzentriert werden. Diese aufkon- 
zentrierte FermentationsbrQhe kann anschliefiend durch Gefriertrocknung, Spruhtrocknung, 
1 0 Spruhgranulation oder durch anderweitige Verfahren aufgearbeitet werden. 

Es ist aber auch moglich die schwefelhaltigen Feinchemikalien, insbesonder L-Methionin, weiter 
aufzureinigen. Hierzu wird die produkthaltige Briihe nach dem Abtrennen der Biomasse einer 
Chromatographie mit einem geeigneten Harz unterworfen, wobei das gewQnschte Produkt oder 
die Verunreinigungen ganz oder teilweise auf dem Chromatographieharz zuriickgehalten wer- 
den. Diese Chromatographieschritte konnen notigenfalls wiederholt werden, wobei die gleichen 
oder andere Chromatographieharze verwendet werden. Der Fachmann ist in der Auswahl der 
geeigneten Chromatographieharze und ihrerwirksamsten Anwendung bewandert Das gereinig- 
te Produkt kann durch Filtration oder Ultrafiltration konzentriert und bei einer Temperatur aufbe- 
wahrt werden, bei der die Stabilitat des Produktes maximal ist. 

Die Identitat und Reinheit der isolierten Verbindung(en) kann durch Techniken des Standes der 
Technik bestimmt werden. Diese umfassen Hochleistungs-FIQssigkeitschromatographie (HPLC), 
spektroskopische Verfahren, Farbeverfahren, DQnnschichtchromatographie, NIRS, Enzymtest 
25 oder mikrobiologische Tests. Diese Analyseverfahren sind zusammengefafit in: Patek et al. 
(1994) Appl. Environ. Microbiol. 60:133-140; Malakhova et al. (1996) Biotekhnologiya 1 1 27-32; 
und Schmidt et al. (1998) Bioprocess Engineer. 19:67-70. Ulmann's Encyclopedia of Industrial 
Chemistry (1996) Bd. A27, VCH: Weinheim, S. 89-90, S. 521-540, S. 540-547, S. 559-566, 575- 
581 und S. 581-587; Michal, G (1999) Biochemical Pathways: An Atlas of Biochemistry and Mo- 
30 lecular Biology, John Wiley and Sons; Fallon, A. et al. (1 987) Applications of HPLC in Bioche- 
mistry in: Laboratory Techniques in Biochemistry and Molecular Biology, Bd. 17. 

Die Erfindung wird nun anhand derfolgenden nicht-limitierenden Beispiele naher beschrieben: 

35 Beispiel 1: Konstruktion von pCLiKSMCS 
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Zunachst wurden Ampicillinresistenz und Replikationsursprung des Vektors pBR322 mit den 
Oligonukleotiden p1.3 (SEQ ID NO:55) und p2.3 (SEQ ID NO:56) mit Hilfe der Polymerase- 
Kettenreaktion (PCR) amplifiziert. 

p1.3 (SEQ ID NO:55) 

5'-CCCGGGATCCGCTAGCGGCGCGCCGGCCGGCCCGGTGTGAAATACCGCACAG-3' 
p2.3 (SEQ ID NO:56) 

5'-TCTAGACTCGAGCGGCCGCGGCCGGCCTTTAAATTGAAGACGAAAGGGCCTCG-3' 

Neben den zu pBR322 komplementaren Sequenzen, enthaltdas Oligonukleotid p1.3 (SEQ ID 
NO:55) in 5'-3' Richtung die SchnittstellenfOrdie Restriktionsendonukleasen Smal, BamHI, Nhel 
und AscI und das Oligonukleotid p2.3 (SEQ ID NO:56) in 5-3' Richtung die Schnittstellen fur 
die Restriktionsendonukleasen Xbal, Xhol, Notl und Dral. Die PCR Reaktion wurde nach Stan- 
dardmethode wie Innis et al. (PCR Protocols. A Guide to Methods and Applications, Academic 
Press (1990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) durchgefOhrt Das erhalte- 
ne DNA Fragment mit einer Grolie von ungefahr 2,1 kb wurde mit dem GFX™PCR, DNA and 
Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers gerei- 
nigt. Die stumpfen Enden des DNA-Fragmentes wurden mit dem Rapid DNA Ligation Kit (Roche 
Diagnostics, Mannheim) nach Angaben des Herstellers miteinander ligiert und der Ligationsan- 
satz nach Standardmethoden wie in Sambrook et al. (Molecular Cloning. A Laboratory Manual, 
Cold Spring Harbor, beschrieben(1989)), in kompetente E.coli XL-1Blue (Stratagene, La Jolla, 
USA) transformiert. Eine Selektion auf Plasmid tragende Zellen wurde durch das Ausplattieren 
auf Ampicillin (50ug/ml) haltigen LB Agar (Lennox, 1955, Virology, 1:190) erreicht. 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und Qber Restriktionsverdaus OberprOft. Das so 
erhaltene Plasmid erhalt den Namen pCLiKI . 

Ausgehend vom Plasmid pWLT1 (Liebl et al., 1 992) als Template fOr eine PCR Reaktion wurde 
mit den Oligonukleotiden neol (SEQ ID NO:57) und neo2 (SEQ ID NO:58) eine Kanamycin- 
Resistenzcassette amplifiziert. 

neol (SEQ ID NO:57): 

5'-GAGATCTAGACCCGGGGATCCGCTAGCGGGCTGCTAAAGGAAGCGGA-3' 
neo2 (SEQ ID NO:58): 
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5-GAGAGGCGCGCCGCTAGCGTGGGCGAAGAACTCCAGCA-3' 

Neben den zu pWLT1 komplementaren Sequenzen, enthalt das Oligonukleotid neol in 5-3' 
Richtung die Schnittstellen fur die Restriktionsendonukteasen Xbal, Smal, BamHl, Nhel und das 
5 Oligonukleotid neo2 (SEQ ID NO:58) in 5 -3' Richtung die Schnittstellen fdr die Restriktionsen- 
donukleasen AscI und Nhel. Die PGR Reaktion wurde nach Standardmethode wie Innis et al. 
(PCR Protocols. A Guide to Methods and Applications, Academic Press (1990)) mit PfuTurbo 
Polymerase (Stratagene, La Jolla, USA) durchgefuhrt. Das erhaltene DNA Fragment mit einer 
Grofle von ungefahr 1 ,3 kb wurde mit dem GFX™PCR, DNA and Gel Band Purification Kit (A- 
10 mersham Pharmacia, Freiburg) nach Angaben des Herstellers gereinigt. Das DNA-Fragment 
wurde mit den Restriktionsendonukleasen Xbal und AscI (New England Biolabs, Beverly, USA) 
geschnitten und im Anschlufi daran emeut mit dem GFX™PCR, DNA and Gel Band Purification 

• Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers gereinigt. Der Vektor 
pCLiKI wurde ebenfalls mit den Restriktionsendonukleasen Xbal und AscI geschnitten und mit 
15 alkalischer Phosphatase (Roche Diagnostics, Mannheim) nach Angaben des Herstellers 
dephosphoryliert. Nach Elektrophorese in einem 0,8%igen Agarosegel wurde der linearisierte 
Vektor (ca. 2,1 kb) mit dem GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharma- 
cia, Freiburg) nach Angaben des Herstellers isoliert. Dieses Vektor-Fragment wurde mit Hilfe 
des Rapid DNA Ligation Kit (Roche Diagnostics, Mannheim) nach Angaben des Herstellers mit 
20 dem geschnittenen PCR Fragment ligiert und der Ligationsansatz nach Standardmethoden wie 
in Sambrook et al. (Molecular Cloning. A Laboratory Manual, Cold Spring Harbor, beschrie- 
ben(1 989)), in kompetente E.coli XL-1 Blue (Stratagene, La Jolla, USA) transformiert. Eine Selek- 
tion auf Plasmid tragende Zellen wurde durch das Ausplattieren auf Ampicillin (50pg/ml) und 
Kanamycin (20pg/ml) haltigen LB Agar (Lennox, 1955, Virology, 1:190) erreicht. 

■ ■ Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und Qber Restriktionsverdaus uberpruft. Das so 
erhaltene Plasmid erhalt den Namen pCLiK2. 

30 Der Vektor pCLiK2 wurde mit der Restriktionsendonuklease Dral (New England Biolabs, Beverly, 
USA) geschnitten. Nach Elektrophorese in einem 0,8%igen Agarosegel wurde ein ca. 2,3 kb 
grolies Vektorfragment mit dem GFX™PCR, DNA and Gel Band Purification Kit (Amersham 
Pharmacia, Freiburg) nach Angaben des Herstellers isoliert. Dieses Vektor-Fragment wurde mit 
Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, Mannheim) nach Angaben des Herstellers 

35 religiert und der Ligationsansatz nach Standardmethoden wie in Sambrook et al. (Molecular Clo- 
ning. A Laboratory Manual, Cold Spring Harbor, beschrieben (1989)), in kompetente E.coli XL- 
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1Blue (Stratagene, La Jolla, USA) transformiert. Eine Selektion auf Plasmid tragende Zellen 
wurde durch das Ausplattieren auf Kanamycin (20|jg/ml) haltlgen LB Agar (Lennox, 1955, Viro- 
logy, 1:190) erreicht 



5 Die Plasmid-DNA eines individuellen Klons wurde mitdem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und Ober Restriktionsverdaus uberprOfL Das so 
erhaltene Plasmid erhalt den Namen pCLiK3. 

Ausgehend vom Plasmid pWLQ2 (Liebl et at. 1 1 992) als Template fOr eine PCR Reaktion wurde 
10 mit den Oligonukleotiden cg1 ((SEQ ID NO:59) und cg2 (SEQ ID NO:60) der Repiikation- 
sursprung pHM1519 amplifiziert. 




cg1 (SEQ ID NO:59): 

5X3AGAGGGCGGCCGCGCAAAGTCCCGCTTCGTGAA-3* 



cg2 (SEQ ID NO:60): 

5-GAGAGGGCGGCCGCTCAAGTCGGTCAAGCCACGC-3' 



Neben den zu pWLQ2 komplementaren Sequenzen, enthalten die Oligonukleotide cg1 (SEQ ID 
20 NO:59) und cg2 (SEQ ID NO:60) Schnittstellen fur die Restriktionsendonuklease Notl. Die PCR 
Reaktion wurde nach Standardmethode wie Innis et at. (PCR Protocols. A Guide to Methods and 
Applications, Academic Press (1990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) 
durchgefOhrt. Das erhaltene DNA Fragment mit einerGrSlie von ungefahr2,7 kb wurde mitdem 
GFX™PCR, DNA and Gel Band Purification Kit(Amersham Pharmacia, Freiburg) nach Angaben 

#des Herstellers gereinigt Das DNA-Fragment wurde mit der Restriktionsendonuklease Notl 
(New England Biolabs, Beverly, USA) geschnitten und im Anschluli daran erneut mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt. DerVektor pCLiK3 wurde ebenfalls mit der Restriktionsendonuklease 
Notl geschnitten und mit alkalischer Phosphatase (Roche Diagnostics, Mannheim)) nach Anga- 
30 ben des Herstellers dephosphoryliert. Nach Elektrophorese in einem 0,8%igen Agarosegel wur- 
de der linearisierte Vektor (ca. 2,3kb) mit dem GFX™PCR, DNA and Gel Band Purification Kit 
(Amersham Pharmacia, Freiburg) nach Angaben des Herstellers isoliert. Dieses Vektor- 
Fragment wurde mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, Mannheim) nach An- 
gaben des Herstellers mit dem geschnittenen PCR Fragment ligiert und der Ligationsansatz 
35 nach Standardmethoden wie in Sambrook et al. (Molecular Cloning. A Laboratory Manual, Cold 
Spring Harbor, beschrieben(1989)), in kompetente E.coli XL-1Blue (Stratagene, La Jolla, USA) 
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transformiert. Eine Selektion auf Plasmid tragende Zeilen wurde durch das Ausplattieren auf 
Kanamycin (20pg/ml) haltlgen LB Agar (Lennox, 1955, Virology, 1 :190) erreicht. 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
5 Hilden) nach Angaben des Herstellers isoliert und Ober Restriktionsverdaus uberpriift Das so 
erhaltene Plasmid erhalt den Namen pCLiKS. 

Fur die Erweiterung von pCLik5 urn eine „multiple cloning site" (MCS) wurden die beide syntheti- 
schen, weitestgehend komplementaren Oligonukleotide HS445 ((SEQ ID NO:61) und HS446 
10 (SEQ ID NO:62), die Schnittstellen fur die Restriktionsendonukleasen Swal, Xhoi, Aatl, Apal, 
Asp718, Mlul, Ndel, Spel, EcoRV, Sail, Clal, BamHI, Xbal und Smal enthalten, durch gemein- 
sames erhitzen auf 95°C und langsames abkuhlen zu einem doppelstrangigen DNA-Fragment 
vereinigt. 



* 



HS445 (SEQ ID NO:61): 

5'-TCGAATTTAAATCTCGAGAGGCCTGACGTCGGGCCCGGTACCACGCGTCATATGACTAG 

TTCGGACCTAGGGATATCGTCGACATCGATGCTCTTCTGCGTTAATTAACAATTGGGATCC 

TCTAGACCCGGGATTTAAAT-3' 



20 HS446 (SEQ ID NO:62): 

5'-GATCATTTAAATCCCGGGTCTAGAGGATCCCAATTGTTAATTAACGCAGAAGAGCATCGA 

TGTCGACGATATCCCTAGGTCCGAACTAGTCATATGACGCGTGGTACCGGGCCCGACGTC 

AGGCCTCTCGAGATTTAAAT-3' 



25 Der Vektor pCLiKS wurde mit den Restriktionsendonuklease Xhol und BamHI (New England 
m Biolabs, Beverly, USA) geschnitten und mit alkalischer Phosphatase (I (Roche Diagnostics, 
Mannheim)) nach Angaben des Herstellers dephosphoryliert. Nach Elektrophorese in einem 
0,8%igen Agarosegel wurde der linearisierte Vektor (ca. 5,0 kb) mit dem GFX™PCR, DNA and 
Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers iso- 

30 liert. Dieses Vektor-Fragment wurde mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, 
Mannheim) nach Angaben des Herstellers mit dem synthetischen Doppelstrangigen DNA- 
Fragment ligiert und der Ligationsansatz nach Standardmethoden wie in Sambrook et al. (Mole- 
cular Cloning. A Laboratory Manual, Cold Spring Harbor, beschrieben(1989)), in kompetente 
E.coli XL-1Blue (Stratagene, La Jolla, USA) transformiert. Eine Selektion auf Plasmid tragende 

35 Zeilen wurde durch das Ausplattieren auf Kanamycin (20pg/ml) haltigen LB Agar (Lennox, 1 955, 
Virology, 1:190) erreicht. 
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Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und Ober Restriktionsverdaus QberprtifL Das so 
erhaltene Plasmid erhalt den Namen pCLiK5MCS. 

Sequenzierungsreaktionen wurden nach Sanger etal. (1977) Proceedings of the National Aca- 
demy of Sciences USA 74:5463-5467 durchgefOhrt. Die Sequenzierreaktionen wurden mittels 
ABI Prism 377 (PE Applied Biosystems, Weiterstadt) aufgetrennt und ausgewertet 

Das entstandene Plasmid pCLiK5MCS ist als SEQ ID NO: 65 aufgefiihrt. 

Beispiel 2: Konstruktion von pCLiK5MCS integratlv sacB 

Ausgehend vom Plasmid pK19mob (Schaferetal., Gene 145,69-73(1 994)) als Template fQreine 
PCR Reaktion wurde mit den Oligonukleotiden BK1732 und BK1733 das Bacillus subtilis sacB 
Gen (kodierend fur Levan Sucrase) amplifiziert. 

BK1732(SEQ ID NO:63): 

5'-GAGAGCGGCCGCCGATCCTTTTTAACCCATCAC-3' 
BK1733 (SEQ ID NO:64): 

5'-AGGAGCGGCCGCCATCGGCATTTTCTTTTGCG-3 , 

Neben den zu pEK19mobsac komplementaren Sequenzen, enthalten die Oligonukleotide 
BK1732 und BK1733 Schnittstellen fOr die Restriktionsendonuklease Notl. Die PCR Reaktion 
wurde nach Standardmethode wie Innis et at. (PCR Protocols. A Guide to Methods and Applica- 
tions, Academic Press (1990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) durchge- 
fOhrt. Das erhaltene DNA Fragment mit einer Grolie von ungefahr 1 ,9 kb wurde mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt. Das DNA-Fragment wurde mit der Restriktionsendonuklease Notl 
(New England Biolabs, Beverly, USA) geschnitten und im Anschluli daran emeut mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt. 

Der Vektor pCLiK5MCS (hergestellt gemali Beispiel 1 ) wurde ebenfalls mit der Restriktionsen- 
donuklease Notl geschnitten und mit alkalischer Phosphatase (I (Roche Diagnostics, Mann- 
heim)) nach Angaben des Herstellers dephosphoryliert. Nach Elektrophorese in einem 0,8%igen 
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Agarosegel wurde ein ungefahr 2,4 kb groftes Vektorfragment mit dem GFX™PCR, DNA and 
Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers iso- 
liert. Dieses Vektor-Fragment wurde mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, 
Mannheim) nach Angaben des Herstellers mit dem geschnittenen PCR Fragment ligiert und der 
5 Ligationsansatz nach Standardmethoden wie in Sambrook et al. (Molecular Cloning. A Laborato- 
ry Manual, Cold Spring Harbor, beschrieben(1989)), in kompetente E.coli XL-1 Blue (Stratagene, 
La Jolla, USA) transformiert. Eine Selektion auf Plasmid tragende Zellen wurde durch das Aus- 
plattieren auf Kanamycin (20pg/ml) haltigen LB Agar (Lennox, 1955, Virology, 1:190) erreicht. 

1 0 Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und Ober Restriktionsverdaus uberpriift. Das so 
erhaltene Plasmid erhalt den Namen pCLiKSMCS integrativ sacB. 




Sequenzierungsreaktionen wurden nach Sanger et al. (1977) Proceedings of the National Aca- 
1 5 demy of Sciences USA 74:5463-5467 durchgefOhrt. Die Sequenzierreaktionen wurden mittels 
ABI Prism 377 (PE Applied Biosystems, Weiterstadt) aufgetrennt und ausgewertet. 

Das entstandene Plasmid pCLiKSMCS integrativ sacB ist als SEQ ID NO: 66 aufgefuhrt. 

20 Weitere Vektoren die zur erfindungsgemalien Expression oder Oberproduktion von metY-Genen 
geeignet sind, konnen in analoger Weise herstellt werden. 
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Patentanspriiche 

1. Verfahren zur fermentativen Herstellung wenigstens einer schwefelhaltigen 
Feinchemikalie, welches folgende Schritte umfasst: 

a) Fermentation einer die gewunschte schwefelhaltige Feinchemikalie 
produzierenden coryneformen Bakterienkultur, wobei in den coryneformen 
Bakterien zumindest eine heterologe Nukleotidsequenz exprimiert wird, 
welche fur ein Protein mit O-Acetyl-Homoserin-Sulfhydrolase (metY) -Aktivitat 
kodiert; 

b) Anreicherung der schwefelhaltigen Feinchemikalie im Medium oder in den 
Zellen der Bakterien, und 

c) Isolieren der schwefelhaltigen Feinchemikalie. 

2. Verfahren nach Anspruch 1, wobei die schwefelhaltige Feinchemikalie L-Methionin 
umfasst. 

3. Verfahren nach einem der vorhergehenden Anspruche, wobei die heterologe metY- 
kodierende Nukleotidsequenz zur metY-kodierenden Sequenz aus Corynebacterium 
glutamicum ATCC 13032 eine Sequenzhomologie vom weniger als 100% aufweist. 

4. Verfahren nach Anspruch 3, wobei die metY-kodierende Sequenz aus einem der 
folgenden Organismen abgeleitet ist: 



Corynebacterium diphteriae 


ATCC 14779 


Mycobacterium tuberculosis 
CDC1551 


ATCC 25584 


Clostridium acetobutylicum 


ATCC 824 


Bacillus halodurans 


ATCC21591 


Bacillus stearothermophilus 


ATCC 12980 


Chlorobium tepidum 


ATCC 49652 


Synechococcus sp. 


ATCC27104 


Emericella nidulans 


ATCC 36104 


Bacteroides fragilis 


ATCC 25285 


Lactococcus lactis 


ATCC 7962 


Bordetella bronchiseptica 


ATCC 19395 


Pseudomonas aeruginosa 


ATCC 17933 


Nitrosomonas europaea 


ATCC 19718 
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Sinorhizobium meliloti 


ATCC 4399 


Thermotoqa maritima 


ATCC 43589 


Streptococcus mutans 


ATCC 25175 


Burkholderia cepacia 


ATCC 25416 


Deinococcus radiodurans 


ATCC 13939 


Rhodobacter capsulatus 


ATCC 11166 


Pasteurella multocida 


ATCC 6530 


Clostridium difficile 


ATCC 9689 


Campylobacter jejuni 


ATCC 33560 


Streptococcus pneumoniae 


ATCC 6308 


Saccharomyces cerevisiae 


ATCC 2704 


Kluyveromyces lactis 


ATCC 8585 


Candida albicans 


ATCC 10231 


Schizosaccharomyces pombe 


ATCC 24969 



5. Verfahren nach einem der vorhergehenden AnsprQche, wobei die metY-kodierende 
Sequenz eine kodierende Sequenz gemali SEQ ID NO:1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 
21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51 und 53 oder eine dazu 
homologe Nukleotidsequenz, welche fur ein Protein mit metY-Aktivitat kodiert, umfasst. 

6. Verfahren nach einem der vorhergehenden Anspruche, wobei die metY-kodierende 
Sequenz fUr ein Protein mit metY-Aktivitat kodiert, wobei das Protein eine 
Aminosauresequenz gemali SEQ ID NO:2, 4, 6, 8, 1 0, 1 2, 1 4, 1 6, 1 8, 20, 22, 24, 26, 28, 
30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 und 54 Oder eine dazu homologe 
Aminosauresequenz, welche fur ein Protein mit metY-Aktivitat steht, umfasst. 

7. Verfahren nach einem der vorhergehenden Anspruche, wobei die kodierende metY- 
Sequenz eine in coryneformen Bakterien replizierbare oder eine stabil in das 
Chromosom intregrierte DNA oder eine RNA ist. 

8. Verfahren gemali Anspruch 7, wobei man 

a) einen mit einem Plasmidvektor transformierten Bakterienstamm einsetzt der 
wenigstens eine Kopie der kodierenden metY-Sequenz unter der Kontrolle 
regulativer Sequenzen tragt, oder 

b) einen Stamm einsetzt, in dem die kodierende metY-Sequenz in das Chromosom 
des Bakteriums integriert wurde 
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9. Verfahren nach einem der vorhergehenden Anspruche, wobei die kodierende metY- 
Sequenz Oberexprimiert wird. 

10. Verfahren gemaft einem der vorhergehenden Anspruche, wobei man Bakterien 
fermentiert, in denen zusatzlich wenigstens ein weiteres Gen des Biosyntheseweges der 
gewQnschten schwefelhaltigen Feinchemikalie verstarkt ist oder derart mutiert ist, dass 
es durch Stoffwechselmetabolite nicht in seiner Aktivitat beeinflusst wird. 

11. Verfahren gemali einem der vorhergehenden Anspruche, wobei man Bakterien 
fermentiert, in denen wenigstens ein Stoffwechselweg zumindestteilweise ausgeschaltet 
sind, der die Bildung der gewQnschten schwefelhaltigen Feinchemikalie verringert. 

12. Verfahren gemali einem der vorhergehenden Anspruche, wobei man coryneforme 
Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt unter 

a) dem fOr eine Aspartatkinase kodierenden Gen lysC, 

b) dem fOr die GIycerinaldehyd-3-Phosphat Dehydrogenase kodierenden Gen gap, 

c) dem fQr die 3-Phosphoglycerat Kinase kodierenden Gen pgk, 

d) dem fur die Pyruvat Carboxylase kodierenden Gen pyc, 

e) dem fur die Triosephosphat Isomerase kodierenden Gen tpi, 

f) dem fur die Homoserin O-Acetyltransferase kodierenden Gen metA, 

g) dem fOr die Cystahionin-gamma-Synthase kodierenden Gen metB, 

h) dem fur die Cystahionin-gamma-Lyase kodierenden Gen metC, 

i) dem fOr die Serin-Hydroxymethyltransferase kodierenden Gen glyA, 

j) dem fur die Methylen-Tetrahydrofolat-Reduktase kodierenden Gen metF, 

k) dem fur das metH Gen, das fOr die Vitamin B1 2 abhangige Methionin-Synthase 
kodiert, 

I) serC Gen, das fQr die Phosphoserin-Aminotransferase kodiert, 

m) dem serB Gen, das fur die Phosphoserin-Phosphatase kodiert, 

n) dem cysE Gen, das fur die Serine Acetyl-Transferase kodiert, und 

o) dem horn Gen, das eine Homoserin-Dehydrogenase kodiert, 



M/43128 



MetY 




BASF Aktiengesellschaft 



20020291 



0000053876 



5 13. 



# 



15 



20 

14. 




25 



Gberexprimiert Oder so mutiert ist, dass die korrespondierenden Proteine, verglichen mit 
nicht mutierten Proteinen, in geringerem Made Oder nicht durch Stoffwechselmetabolite 
in ihrer Aktivitat beeinflusst werden. 

Verfahren gemafi einem der vorhergehenden AnsprGche, wobei man coryneformen 
Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt unter 

a) dem fOr die Homoserine-Kinase kodierenden Gen thrB, 

b) dem fOr die Threonin Dehydratase kodierenden Gen ilvA, 

c) dem fur die Threonin Synthase kodierenden Gen thrC 

d) dem fur die Meso-Diaminopimelat D-Dehydrogenase kodierenden Gen ddh 

e) dem fur die Phosphoenolpyruvat-Carboxykinase kodierenden Gen pck, 

f) dem far die Glucose-6-Phosphat-6-lsomerase kodierenden Gen pgi, 

g) dem fur die Pyruvat-Oxidase kodierenden Gen poxB, 

h) dem fQr die Dihydrodipicolinat Synthase kodiemden Gen dapA, 

i) dem fur die Dihydrodipicolinat Reduktase kodiemden Gen dapB; oder 
j) dem fQr die Diaminopicolinat Decarboxylase kodiemden Gen 

durch Veranderung der Expressionsrate oder durch Einfuhrung einer gezielten Mutation 
abschwacht ist 

Verfahren gemali einem oder mehreren der vorhergehenden Anspruche, wobei man 
Mikroorganismen der Art Corynebacterium glutamicum einsetzt 

Verfahren zur Herstellung eines L-Methionin haltigen Tierfuttermittel-Additivs aus 
FermentationsbrQhen, welches folgende Schritte umfasst 

a) Kultivierung und Fermentation eines L-Methionin produzierenden 
Mikroorganismus in einem Fermentationsmedium; 

b) Entfernung von Wasser aus der L-Methionin haltigen Fermentationsbruhe; 

c) Entfernung der wahrend der Fermentation gebildeten Biomasse in einer Menge 
von 0 bis 100 Gew.-%; und 

d) Trocknung der gemafi b) und/oder c) erhaltenen FermentationsbrQhe, um das 
Tierfuttermittel-Additiv in der gewunschten Pulver- oder Granulatform zu erhalten. 
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16. Verfahren gemaft Anspruch 15, wobei man Mikroorganismen gemali der Definition in 
einem der AnsprUche 1 bis 14 einsetzt. 
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Zusammenfassung 

Die Erfindung betrifft Verfahren zur fermentativen Herstellung von schwefelhaltigen 
Feinchemikalien, insbesondere L-Methionin, unterVerwendung von Bakterien, in denen einefur 
5 ein Methionin-Synthase (metH)-Gen kodierende Nukleotidsequenzen exprimiert wird. 
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<110> BASF AG 



<120> Verfahren zur Herstellung schwefelhal tiger Feinchemikalien 



<130> M/43128 



<160> 66 



,<170> Patentln version 3.1 



<210> 1 

<211> 1317 

<212> DNA 

<213> Corynebacterium diphtheriae 
<220> 

<221> CDS 

<222> (1) . . (1317) 
<223> 



<400> 1 

atg cca aca aaa tac gat aat tec aat gec aac aaa tgg ggt ttc gag 4 8 

Met Pro Thr Lys Tyr Asp Asn Ser Asn Ala Asn Lys Trp Gly Phe Glu 
15 10 15 

act cgc tec ate cac gca gga caa age gtc gat agt gat ace agt gee 96 
Thr Arg Ser He His Ala Gly Gin Ser Val Asp Ser Asp Thr Ser Ala 
20 25 30 

cgc aac eta ccg att tac ctg aca tea teg tac gtt ttt aat gac gee 144 
Arg Asn Leu Pro He Tyr Leu Thr Ser Ser Tyr Val Phe Asn Asp Ala 
35 40 45 

gaa cac gca gca aac cgc ttc aac ctt tec gac gee ggc ccg gtt tac 192 
Glu His Ala Ala Asn Arg Phe Asn Leu Ser Asp Ala Gly Pro Val Tyr 
50 55 60 

tct cgc ctg ace aac cca act gtc gcg gca gtc gaa gaa cgc eta gee 240 
Ser Arg Leu Thr Asn Pro Thr Val Ala Ala Val Glu Glu Arg Leu Ala 
65 70 75 80 

M/43128 MetY 



fa 



aat ctt gaa ggt ggc gta cac gcc gta ctt ttc get tec gga atg gec 288 
Asn Leu Glu Gly Gly Val His Ala Val Leu Phe Ala Ser Gly Met Ala 
85 90 95 

gcc gaa acc gcc gca ate etc aac ate gcc cgc gcg ggt tec cac ate 336 
Ala Glu Thr Ala Ala lie Leu Asn He Ala Arg Ala Gly Ser His He 
100 105 110 

gtg tec agt cct cgc att tac ggc ggc acc gaa aca etc ttt gcc gtc 3 84 

Val Ser Ser Pro Arg He Tyr Gly Gly Thr Glu Thr Leu Phe Ala Val 
115 120 125 

aca ttg gca cgc ctg ggc ate gaa acc act ttc gta gaa aat cct gac 432 
Thr Leu Ala Arg Leu Gly He Glu Thr Thr Phe Val Glu Asn Pro Asp 
130 135 140 



^1^4; 



gac cca gcc tea tgg gag get gca gtt caa gac aac acg gta get etc 
Asp Pro Ala Ser Trp Glu Ala Ala Val Gin Asp Asn Thr Val Ala Leu 
45 150 155 160 




480 



528 



c gga gaa acc ttc get aat cca caa gca gac gtg ctt gat att ccc 
*Tyr Gly Glu Thr Phe Ala Asn Pro Gin Ala Asp Val Leu Asp He Pro 
165 170 175 

gca ate gca gag gtt gcc cat aaa cat caa gta cca ctg ate gtc gac 57 6 

Ala He Ala Glu Val Ala His Lys His Gin Val Pro Leu He Val Asp 
180 185 190 

aac acc etc gca acc gca gcc ctt gta cgc ccc etc gaa etc ggt gca 624 
Asn Thr Leu Ala Thr Ala Ala Leu Val Arg Pro Leu Glu Leu Gly Ala 
195 200 205 

gac gtc gtc gtg gca tec eta acc aag ttc tac acc gga aat ggc tec 672 
Asp Val Val Val Ala Ser Leu Thr Lys Phe Tyr Thr Gly Asn Gly Ser 
210 215 220 

gga etc ggc gga gtg ctt ate gac ggc gga aac ttc gac tgg acc gtc 72 0 

Gly Leu Gly Gly Val Leu He Asp Gly Gly Asn Phe Asp Trp Thr Val 
225 230 235 240 

ca cgc aac ggc gaa ccg ate ttc ccc gac ttt gtc acc cca gat ccc 768 
hr Arg Asn Gly Glu Pro He Phe Pro Asp Phe Val Thr Pro Asp Pro 
245 250 255 

gcc tat cac ggt etc aag tat tec gat ctt ggt gcc ccc gcc ttc gga 816 
Ala Tyr His Gly Leu Lys Tyr Ser Asp Leu Gly Ala Pro Ala Phe Gly 
260 265 270 

eta aag get cgc gtc gga etc ctg cgc gac acc ggc gca gcc cca tea 864 
Leu Lys Ala Arg Val Gly Leu Leu Arg Asp Thr Gly Ala Ala Pro Ser 
275 280 285 

cca etc aac gca tgg ate acc gca caa ggg etc gac acc etc teg eta 912 
Pro Leu Asn Ala Trp He Thr Ala Gin Gly Leu Asp Thr Leu Ser Leu 
290 295 300 

cga gta caa cgc cac aac gaa aac gca etc gca gta gca caa ttc etc 960 
Arg Val Gin Arg His Asn Glu Asn Ala Leu Ala Val Ala Gin Phe Leu 
305 310 315 320 

gcc aac cac gag aaa gta gcc aag gtt aac tac gca ggc ctt ccc gac 1008 
Ala Asn His Glu Lys Val Ala Lys Val Asn Tyr Ala Gly Leu Pro Asp 

M/43128 MetY 



325 330 335 

tec cct tgg tac cca gtc aaa gaa aaa etc gga ttc gac tac ace ggc 1056 
Ser Pro Trp Tyr Pro Val Lys Glu Lys Leu Gly Phe Asp Tyr Thr Gly 
340 345 350 

tec gta ctt tec ttt gac gtt aaa ggt gga aaa aac gaa gca tgg cgc 1104 
Ser Val Leu Ser Phe Asp Val Lys Gly Gly Lys Asn Glu Ala Trp Arg 
355 360 365 

ttt ate gac gca etc aaa eta cac teg aac etc gee aac gtc gga gac 1152 
Phe lie Asp Ala Leu Lys Leu His Ser Asn Leu Ala Asn Val Gly Asp 
370 375 380 

gta cgt tec etc gta gtc cac cca gcg ace ace acg cac tea caa teg 1200 
Val Arg Ser Leu Val Val His Pro Ala Thr Thr Thr His Ser Gin Ser 
385 390 . 395 400 




gaa gaa teg gca ctt eta gee gca gga att aat caa gca ace ate cga 
Glu Glu Ser Ala Leu Leu Ala Ala Gly He Asn Gin Ala Thr He Arg 
405 410 415 



1248 



_ ftc tec gtc ggc ate gaa tec ate gac gac ate ate gee gac etc aca 12 96 

w Leu Ser Val Gly He Glu Ser He Asp Asp He He Ala Asp Leu Thr 
420 425 430 



gca ggt ttc gac gca ate taa 
Ala Gly Phe Asp Ala He 
435 



<210> 2 

<211> 438 

<212> PRT 

<213> Corynebacterium diphtheriae 




00> 2 

^""'iVIet Pro Thr Lys Tyr Asp Asn Ser Asn Ala Asn Lys Trp Gly Phe Glu 
15 10 15 



Thr Arg Ser He His Ala Gly Gin Ser Val Asp Ser Asp Thr Ser Ala 
20 25 30 



Arg Asn Leu Pro He Tyr Leu Thr Ser Ser Tyr Val Phe Asn Asp Ala 
35 40 45 



Glu His Ala Ala Asn Arg Phe Asn Leu Ser Asp Ala Gly Pro Val Tyr 
50 55 60 



Ser Arg Leu Thr Asn Pro Thr Val Ala Ala Val Glu Glu Arg Leu Ala 
65 70 75 80 



1317 
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Asn Leu Glu Gly Gly Val His Ala Val Leu Phe Ala Ser Gly Met Ala 
85 90 95 



Ala Glu Thr Ala Ala lie Leu Asn He Ala Arg Ala Gly Ser His He 
100 105 HO 



Val Ser Ser Pro Arg He Tyr Gly Gly Thr Glu Thr Leu Phe Ala Val 
115 120 125 



Thr Leu Ala Arg Leu Gly He Glu Thr Thr Phe Val Glu Asn Pro Asp 
130 135 140 

Asp Pro Ala Ser Trp Glu Ala Ala Val Gin Asp Asn Thr Val Ala Leu 

145 150 155 160 



r Gly Glu Thr Phe Ala Asn Pro Gin Ala Asp Val Leu Asp He Pro 
165 170 175 




Ala He Ala Glu Val Ala His Lys His Gin Val Pro Leu He Val Asp 
180 185 190 



Asn Thr Leu Ala Thr Ala Ala Leu Val Arg Pro Leu Glu Leu Gly Ala 
195 200 205 



Asp Val Val Val Ala Ser Leu Thr Lys Phe Tyr Thr Gly Asn Gly Ser 
210 215 220 



Gly Leu Gly Gly Val Leu He Asp Gly Gly Asn Phe Asp Trp Thr Val 
225 230 235 240 



r Arg Asn Gly Glu Pro He Phe Pro Asp Phe Val Thr Pro Asp Pro 
245 250 255 



Ala Tyr His Gly Leu Lys Tyr Ser Asp Leu Gly Ala Pro Ala Phe Gly 
260 265 270 



Leu Lys Ala Arg Val Gly Leu Leu Arg Asp Thr Gly Ala Ala Pro Ser 
275 280 285 



Pro Leu Asn Ala Trp He Thr Ala Gin Gly Leu Asp Thr Leu Ser Leu 
290 295 300 



Arg Val Gin Arg His Asn Glu Asn Ala Leu Ala Val Ala Gin Phe Leu 
305 310 315 320 



Ala Asn His Glu Lys Val Ala Lys Val Asn Tyr Ala Gly Leu Pro Asp 
325 330 335 
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Ser Pro Trp Tyr Pro Val Lys Glu Lys Leu Gly Phe Asp Tyr Thr Gly 
340 345 350 



Ser Val Leu Ser Phe Asp Val Lys Gly Gly Lys Asn Glu Ala Trp Arg 
355 360 365 



Phe lie Asp Ala Leu Lys Leu His Ser Asn Leu Ala Asn Val Gly Asp 
370 3 75 380 



Val Arg Ser Leu Val Val His Pro Ala Thr Thr Thr His Ser Gin Ser 
385 390 395 400 



Glu Glu Ser Ala Leu Leu Ala Ala Gly lie Asn Gin Ala Thr lie Arg 
405 410 415 



eu Ser Val Gly lie Glu Ser lie Asp Asp lie lie Ala Asp Leu Thr 
420 425 430 



Ala Gly Phe Asp Ala lie 
435 



<210> 3 

<211> 1350 

<212> DNA 

<213> Mycobacterium tuberculosis 



0> 

21> CDS 



<222> (1) . . (1350) 
<223> 



<400> 3 

atg age gec gac age aat age acc gac gec gat ccg acc gcg cat tgg 4 8 

Met Ser Ala Asp Ser Asn Ser Thr Asp Ala Asp Pro Thr Ala His Trp 
1 5 10 15 

teg ttc gaa acc aaa cag ata cac get ggt cag cac cct gat ccg acc 96 
Ser Phe Glu Thr Lys Gin He His Ala Gly Gin His Pro Asp Pro Thr 
20 25 30 

acc aac gec egg get ctg ccg ate tat gcg acc acg teg tac acc ttc 144 
Thr Asn Ala Arg Ala Leu Pro He Tyr Ala Thr Thr Ser Tyr Thr Phe 
35 40 45 
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gac gac acc gcg cac gcc gcc gcc ctg ttc gga ctg gaa att ccg ggc 192 
Asp Asp Thr Ala His Ala Ala Ala Leu Phe Gly Leu Glu He Pro Gly 
50 |55 60 

aat ate tac acc egg ate ggc aac ccc acc acc gac gtc gtc gag cag 240 
Asn He Tyr Thr Arg He Gly Asm Pro Thr Thr Asp Val Val Glu Gin 
65 70 75 80 



cgc ate gcc gcg etc gag ggc ggt gtg gcc gcg ctg ttc ctg teg teg 
Arg He Ala Ala Leu Glu Gly Gly Val Ala Ala Leu Phe Leu Ser Ser 
85 90 95 



gat cac ate gtg tec age ccg cgc ctg tac ggc ggc acc tac aac ctg 
Asp His He Val Ser Ser Pro Arg Leu Tyr Gly Gly Thr Tyr Asn Leu 




ate gtc gac aac acc ate gcc acg cca tac ctg ate caa ccg ttg gcc 

He Val Asp Asn Thr He Ala Thr Pro Tyr Leu He Gin Pro Leu Ala 
195 200 205 

g ggc gcc gac ate gtc gtg cat teg gcc acc aag tac ctg ggc ggg 

n Gly Ala Asp He Val Val His Ser Ala Thr Lys Tyr Leu Gly Gly 
210 215 220 



tgg acc cag ggc cgc ttc ccc ggc ttc acc acc ccc gac ccc age tac 
Trp Thr Gin Gly Arg Phe Pro Gly Phe Thr Thr Pro Asp Pro Ser Tyr 
245 250 255 

cac ggc gtg gtg ttc gcc gag ctg ggt cca ccg gcg ttt gcg etc aaa 
His Gly Val Val Phe Ala Glu Leu Gly Pro Pro Ala Phe Ala Leu Lys 
260 265 270 



288 



ggg ca g g cc gcg g & g a °g ttc 9 CC atc tt: 9 aac ct g 9 CC 99° 9 C 9 99° 336 

Gly Gin Ala Ala Glu Thr Phe Ala He Leu Asn Leu Ala Gly Ala Gly 
100 105 110 



384 



115 120 125 

k tc cac tat teg ctg gcc aag etc ggc atc gag gtc age ttc gtc gac 432 

e His Tyr Ser Leu Ala Lys Leu Gly He Glu Val Ser Phe Val Asp 
130 135 140 



gat ccg gac gat ctg gac acc tgg cag gcg gcg gta egg ccc aac acc 480 
Asp Pro Asp Asp Leu Asp Thr Trp Gin Ala Ala Val Arg Pro Asn Thr 
145 ^ 150 . 155 160 

aag gcg ttc ttc gcc gag acc atc tec aac ccg cag atc gac ctg ctg 52 8 

Lys Ala Phe Phe Ala Glu Thr He Ser Asn Pro Gin He Asp Leu Leu 
165 170 175 

gac acc ccg gcg gtt tec gag gtc gcc cat cgc aac ggg gtg ccg ttg 576 
Asp Thr Pro Ala Val Ser Glu Val Ala His Arg Asn Gly Val Pro Leu 
180 185 190 



624 



672 



cac ggt gcc gcc atc gcg ggt gtg atc gtc gac ggc ggc aac ttc gat 720 
His Gly Ala Ala He Ala Gly Val He Val Asp Gly Gly Asn Phe Asp 
225 230 235 240 



768 



816 



get cga gtg cag ctg etc cgt gac tac ggc teg gcg get teg ccg ttc 864 
Ala Arg Val Gin Leu Leu Arg Asp Tyr Gly Ser Ala Ala Ser Pro Phe 
275 280 285 

aac gcg ttc ttg gtg gcg cag ggt ctg gaa acg ctg age ctg egg atc 912 
Asn Ala Phe Leu Val Ala Gin Gly Leu Glu Thr Leu Ser Leu Arg He 
290 295 300 
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gag egg cac gtc gec aac gcg cag cgc gtc gec gag ttc ctg gec gec 960 
Glu Arg His Val Ala Asn Ala Gin Arg Val Ala Glu Phe Leu Ala Ala 
305 310 315 320 

cgc gac gac gtg ctt teg gtc aac tat gcg ggg ctg ccc tec teg ccc 1008 
Arg Asp Asp Val Leu Ser Val Asn Tyr Ala Gly Leu Pro Ser Ser Pro 
325 330 335 

tgg cat gag egg gee aag agg ctg gcg ccc aag gga ace ggg gee gtg 1056 
Trp His Glu Arg Ala Lys Arg Leu Ala Pro Lys Gly Thr Gly Ala Val 
340 345 350 

ctg tec ttc gag ttg gee ggc ggc ate gag gec ggc aag gca ttc gtg 1104 
Leu Ser Phe Glu Leu Ala Gly Gly lie Glu Ala Gly Lys Ala Phe Val 
355 360 365 

aac gcg ttg aag ctg cac age cac gtc gee aac ate ggt gac gtg cgc 1152 
Asn Ala Leu Lys Leu His Ser His Val Ala Asn lie Gly Asp Val Arg 
370 375 380 

g ctg gtg ate cac ccg gca teg acc act cat gee cag ctg age ccg 12 00 

fer Leu Val lie His Pro Ala Ser Thr Thr His Ala Gin Leu Ser Pro 
385 390 395 400 

gec gag cag ctg gcg acc ggg gtc age ccg ggc ctg gtg cgt ttg get 1248 
Ala Glu Gin Leu Ala Thr Gly Val Ser Pro Gly Leu Val Arg Leu Ala 
405 410 415 

gtg ggc ate gaa ggt ate gac gat ate ctg gec gac ctg gag ctt ggc 1296 
Val Gly lie Glu Gly lie Asp Asp He Leu Ala Asp Leu Glu Leu Gly 
420 425 430 

ttt gec gcg gee cgc aga ttc age gec gac ccg cag tec gtg gcg gcg 1344 
Phe Ala Ala Ala Arg Arg Phe Ser Ala Asp Pro Gin Ser Val Ala Ala 
435 440 445 

ttc tga 1350 
Phe 




10> 4 
<211> 449 
<212> PRT 

<213> Mycobacterium tuberculosis 
<400> 4 

Met Ser Ala Asp Ser Asn Ser Thr Asp Ala Asp Pro Thr Ala His Trp 
15 10 15 



Ser Phe Glu Thr Lys Gin He His Ala Gly Gin His Pro Asp Pro Thr 
20 25 30 



Thr Asn Ala Arg Ala Leu Pro He Tyr Ala Thr Thr Ser Tyr Thr Phe 
M/43128 
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35 40 45 



Asp Asp Thr Ala His Ala Ala Ala Leu Phe Gly Leu Glu He Pro Gly 
50 55 60 



Asn He Tyr Thr Arg He Gly Asn Pro Thr Thr Asp Val Val Glu Gin 
65 70 75 80 



Arg He Ala Ala Leu Glu Gly Gly Val Ala Ala Leu Phe Leu Ser Ser 
85 90 95 



Gly Gin Ala Ala Glu Thr Phe Ala He Leu Asn Leu Ala Gly Ala Gly 
100 105 110 



Asp His He Val Ser Ser Pro Arg Leu Tyr Gly Gly Thr Tyr Asn Leu 
115 120 125 



Phe His Tyr Ser Leu Ala Lys Leu Gly He Glu Val Ser Phe Val Asp 
130 135 140 



Asp Pro Asp Asp Leu Asp Thr Trp Gin Ala Ala Val Arg Pro Asn Thr 
145 150 155 160 



Lys Ala Phe Phe Ala Glu Thr He Ser Asn Pro Gin lie Asp Leu Leu 
165 170 175 



Asp Thr Pro Ala Val Ser Glu Val Ala His Arg Asn Gly Val Pro Leu 
180 185 190 



le Val Asp Asn Thr He Ala Thr Pro Tyr Leu He Gin Pro Leu Ala 
195 200 205 



Gin Gly Ala Asp He Val Val His Ser Ala Thr Lys Tyr Leu Gly Gly 
210 215 220 



His Gly Ala Ala He Ala Gly Val He Val Asp Gly Gly Asn Phe Asp 
225 230 . 235 240 



Trp Thr Gin Gly Arg Phe Pro Gly Phe Thr Thr Pro Asp Pro Ser Tyr 
245 250 255 



His Gly Val Val Phe Ala Glu Leu Gly Pro Pro Ala Phe Ala Leu Lys 
260 265 270 



Ala Arg Val Gin Leu Leu Arg Asp Tyr Gly Ser Ala Ala Ser Pro Phe 
275 280 285 
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Asn Ala Phe Leu Val Ala Gin Gly Leu Glu Thr Leu Ser Leu Arg lie 
290 295 300 



Glu Arg His Val Ala Asn Ala Gin Arg Val Ala Glu Phe Leu Ala Ala 
305 310 315 320 



Arg Asp Asp Val Leu Ser Val Asn Tyr Ala Gly Leu Pro Ser Ser Pro 
325 330 335 



Trp His Glu Arg Ala Lys Arg Leu Ala Pro Lys Gly Thr Gly Ala Val 
340 345 350 



Leu Ser Phe Glu Leu Ala Gly Gly lie Glu Ala Gly Lys Ala Phe Val 
355 360 365 




n Ala Leu Lys Leu His Ser His Val Ala Asn lie Gly Asp Val Arg 
370 375 380 



Ser Leu Val lie His Pro Ala Ser Thr Thr His Ala Gin Leu Ser Pro 
385 390 395 400 



Ala Glu Gin Leu Ala Thr Gly Val Ser Pro Gly Leu Val Arg Leu Ala 
405 410 415 



Val Gly lie Glu Gly lie Asp Asp lie Leu Ala Asp Leu Glu Leu Gly 
420 425 430 



Phe Ala Ala Ala Arg Arg £he Ser Ala Asp Pro Gin Ser Val Ala Ala 
435 440 445 



<210> 5 

<211> 1284 

<212>. DNA 

<213> Clostridium acetobutylicum 
<220> 

<221> CDS 

<222> (1) . . (1284) 

<223> 



M/43128 




10 



<400> 5 

atg agt gaa gaa aga aaa ttt ggt ttt gaa aca tta cag gtt cat gca 
Met Ser Glu Glu Arg Lys Phe Gly Phe Glu Thr Leu Gin Val His Ala 
15 10 15 

gga caa gtt get gat cca act aca gga tea aga get gta cct att tat 
Gly Gin Val Ala Asp Pro Thr Thr Gly Ser Arg Ala Val Pro lie Tyr 
20 25 30 

caa aca aca tea tat gta ttt aaa aat get gat cat gca gca aat tta 
Gin Thr Thr Ser Tyr Val Phe Lys Asn Ala Asp His Ala Ala Asn Leu 
35 40 45 

ttt caa ttg aaa gaa cct gga aat gta tat aca agg ata atg aat cca 
Phe Gin Leu Lys Glu Pro Gly Asn Val Tyr Thr Arg He Met Asn Pro 
50 55 60 

aca act gat gta ttt gaa caa aga gta gca get ctt gag ggc gga gtt 
r Thr Asp Val Phe Glu Gin Arg Val Ala Ala Leu Glu Gly Gly Val 

70 75 80 

get gga ctt gca aca gca tea gga ctt gca gca att ace tat get att 
Ala Gly Leu Ala Thr Ala Ser Gly Leu Ala Ala He Thr Tyr Ala He 
85 90 95 

tta aat gtg gca agt get ggg gat gaa att gtt gca gca agt acc tta 
Leu Asn Val Ala Ser Ala Gly Asp Glu He Val Ala Ala Ser Thr Leu 
100 105 110 

tat ggt gga aca tat gaa tta ttt ggg gtt act ctt aag aag ctt gga 
Tyr Gly Gly Thr Tyr Glu Leu Phe Gly Val Thr Leu Lys Lys Leu Gly 
115 120 125 

ata aag gtt gtt ttt gta gat cca gat aat cct gaa aat ata aga aaa 
He Lys Val Val Phe Val Asp Pro Asp Asn Pro Glu Asn He Arg Lys 
130 135 140 



# 



ca ata aat gat agg aca aaa get gta tat ggg gaa act att gga aat 
a He Asn Asp Arg Thr Lys Ala Val Tyr Gly Glu Thr He Gly Asn 
5 150 155 160 



cca aga ata aat gtt ttg gat ata gag gca gta get aaa att gee cat 
Pro Arg He Asn Val Leu Asp He Glu Ala Val Ala Lys He Ala His 
165 170 175 

gaa aat aaa ata cca ctt ata ate gat aat aca ttt ggt aca ccg tat 
Glu Asn Lys He Pro Leu He He Asp Asn Thr Phe Gly Thr Pro Tyr 
180 185 190 

ctt ata aga cct ata gaa ttt gga gca gat ata gtt gta cat tea gca 
Leu He Arg Pro He Glu Phe Gly Ala Asp He Val Val His Ser Ala 
195 200 205 

aca aag ttt ata gga gga cat gga act act ata ggt gga att ata gtt 
Thr Lys Phe He Gly Gly His Gly Thr Thr He Gly Gly He He Val 
210 215 220 

gat ggt gga aaa ttt gat tgg aga get agt gga aag ttt cct gat ttt 
Asp Gly Gly Lys Phe Asp Trp Arg Ala Ser Gly Lys Phe Pro Asp Phe 
225 230 235 240 



M/43128 



96 



144 



192 



240 



288 



336 



384 



432 



480 



528 



576 



624 



672 



720 
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aca aca ccg gat aag age tat aat gga ctt ata tat get gat eta ggt 768 
Thr Thr Pro Asp Lys Ser Tyr Asn Gly Leu lie Tyr Ala Asp Leu Gly 
245 250 255 

gca cct get ttt get tta aaa gca aga gtt caa ctt tta aga aat aca 816 
Ala Pro Ala Phe Ala Leu Lys Ala Arg Val Gin Leu Leu Arg Asn Thr 
260 265 270 

ggt gca acg ctt agt cca caa agt get ttt tat ttc eta caa ggg ttg 864 
Gly Ala Thr Leu Ser Pro Gin Ser Ala Phe Tyr Phe Leu Gin Gly Leu 
275 280 285 

gaa tea ctt tea ctt agg gtt caa aaa cat gtt gat aat aca aga aag 912 
Glu Ser Leu Ser Leu Arg Val Gin Lys His Val Asp Asn Thr Arg Lys 
290 295 300 

gta gtt gaa ttc ttg aag aac cat cca aaa gtt tea tgg ata aat tat 960 
Val Val Glu Phe Leu Lys Asn His Pro Lys Val Ser Trp lie Asn Tyr 
305 310 315 320 



ct gaa ctt gag gaa agt cct tat aaa gag tta gca aat aaa tat ctt 1008 
o Glu Leu Glu Glu Ser Pro Tyr Lys Glu Leu Ala Asn Lys Tyr Leu 
325 330 335 



cca aag ggt gca ggc tea ata ttt aca ttt gga ata aag gga gga ctt 1056 
Pro Lys Gly Ala Gly Ser lie Phe Thr Phe Gly He Lys Gly Gly Leu 
340 345 350 

gaa get ggt aaa aga ttt ata aat agt gtt aaa eta ttc tct ctt ttg 1104 
Glu Ala Gly Lys Arg Phe He Asn Ser Val Lys Leu Phe Ser Leu Leu 
355 360 365 

gca aat gtt gca gat gca aaa tea ctt gtt ata cat cct tea agt aca 1152 
Ala Asn Val Ala Asp Ala Lys Ser Leu Val He His Pro Ser Ser Thr 
370 375 380 

act cat get gaa ctt aat gaa gaa gaa caa aaa gca get ggt gtt act 12 00 

Thr His Ala Glu Leu Asn Glu Glu Glu Gin Lys Ala Ala Gly Val Thr 
385 390 395 400 



a gat atg ata aga ctt tea ata gga gta gag gat gca gag gat tta 124 8 

o Asp Met He Arg Leu Ser He Gly Val Glu Asp Ala Glu Asp Leu 
405 410 415 



ata tgg gac tta aat caa get etc gaa caa get taa 1284 
He Trp Asp Leu Asn Gin Ala Leu Glu Gin Ala 





420 425 


<210> 


6 


<211> 


427 


<212> 


PRT 


<213> 


Clostridium acetobutylicum 


<400> 


6 



Met Ser Glu Glu Arg Lys Phe Gly Phe Glu Thr Leu Gin Val His Ala 
1 5 10 15 
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Gly Gin Val Ala Asp Pro Thr Thr Gly Ser Arg Ala Val Pro lie Tyr 
20 25 30 



Gin Thr Thr Ser Tyr Val Phe Lys Asn Ala Asp His Ala Ala Asn Leu 
35 40 45 



Phe Gin Leu Lys Glu Pro Gly Asn Val Tyr Thr Arg lie Met Asn Pro 
50 55 60 



Thr Thr Asp Val Phe Glu Gin Arg Val Ala Ala Leu Glu Gly Gly Val 
65 70 75 80 




Ala Gly Leu Ala Thr Ala Ser Gly Leu Ala Ala lie Thr Tyr Ala lie 
85 90 95 



u Asn Val Ala Ser Ala Gly Asp Glu lie Val Ala Ala Ser Thr Leu 
100 105 110 



Tyr Gly Gly Thr Tyr Glu Leu Phe Gly Val Thr Leu Lys Lys Leu Gly 
115 12 0 125 



lie Lys Val Val Phe Val Asp Pro Asp Asn Pro Glu Asn lie Arg Lys 
130 135 140 



Ala lie Asn Asp Arg Thr Lys Ala Val Tyr Gly Glu Thr lie Gly Asn 
145 150 155 160 




Pro Arg lie Asn Val Leu Asp lie Glu Ala Val Ala Lys lie Ala His 
165 170 175 



u Asn Lys lie Pro Leu lie lie Asp Asn Thr Phe Gly Thr Pro Tyr 
180 185 190 



Leu lie Arg Pro lie Glu Phe Gly Ala Asp lie Val Val His Ser Ala 
195 200 205 



Thr Lys Phe He Gly Gly His Gly Thr Thr He Gly Gly He He Val 
210 215 220 



Asp Gly Gly Lys Phe Asp Trp Arg Ala Ser Gly Lys Phe Pro Asp Phe 
225 230 235 240 



Thr Thr Pro Asp Lys Ser Tyr Asn Gly Leu He Tyr Ala Asp Leu Gly 
245 250 255 
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Ala Pro Ala Phe Ala Leu Lys Ala Arg Val Gin Leu Leu Arg Asn Thr 
260 265 270 



Gly Ala Thr Leu Ser Pro Gin Ser Ala Phe Tyr Phe Leu Gin Gly Leu 
275 280 * 285 



Glu Ser Leu Ser Leu Arg Val Gin Lys His Val Asp Asn Thr Arg Lys 
290 295 300 



Val Val Glu Phe Leu Lys Asn His Pro Lys Val Ser Trp lie Asn Tyr 
305 310 315 320 



Pro Glu Leu Glu Glu Ser Pro Tyr Lys Glu Leu Ala Asn Lys Tyr Leu 
325 * 330 335 




o Lys Gly Ala Gly Ser lie Phe Thr Phe Gly lie Lys Gly Gly Leu 
340 345 ~ 350 



Glu Ala Gly Lys Arg Phe lie Asn Ser Val Lys Leu Phe Ser Leu Leu 
355 360 ^ 365 



Ala Asn Val Ala Asp Ala Lys Ser Leu Val lie His Pro Ser Ser Thr 
370 375 380 



Thr His Ala Glu Leu Asn Glu Glu Glu Gin Lys Ala Ala Gly Val Thr 
385 390 , 395 400 



Pro Asp Met lie Arg Leu Ser He Gly Val Glu Asp Ala Glu Asp Leu 
405 410 415 



Trp Asp Leu Asn Gin Ala Leu Glu Gin Ala 
420 425 



<210> 7 

<211> 1293 

<212> DNA 

<213> Bacillus halodurans 
<220> 

<221> CDS 



<222> (1) . . (1293) 
<223> 
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<400> 7 

atg aat cat gaa aac caa tgg cag 
Met Asn His Glu Asn Gin Trp Gin 
1 5 

gga cag gag ate gat ccg aca acg 
Gly Gin Glu lie Asp Pro Thr Thr 
20 



tta gaa aca aag gec gtt cat tea 
Leu Glu Thr Lys Ala Val His Ser 
10 15 

ttg teg cga gec gtc cca ttg tac 
Leu Ser Arg Ala Val Pro Leu Tyr 
25 30 



caa acg acg tec tac gga ttt aaa gat aca gac cat gcg gcg aat tta 
Gin Thr Thr Ser Tyr Gly Phe Lys Asp Thr Asp His Ala Ala Asn Leu 
35 40 45 

ttt tea eta agt gaa ttt ggc aat ate tat acc cga ttg atg aac cca 
Phe Ser Leu Ser Glu Phe Gly Asn lie Tyr Thr Arg Leu Met Asn Pro 
50 55 ~ 60 




acg aca gat gtg ttt gaa aaa cgt gtg get gcg tta gaa gga gga gcg 
^ r Thr Asp Val Phe Glu Lys Arg Val Ala Ala Leu Glu Gly Gly Ala 

70 75 80 

gca get tta gcg acg gee tea ggg cag gcg gee att acg tat teg att 
Ala Ala Leu Ala Thr Ala Ser Gly Gin Ala Ala lie Thr Tyr Ser lie 
85 90 95 

tta aat att gcg gag get gga gat gaa ate gtg tec get agt age ctt 
Leu Asn He Ala Glu Ala Gly Asp Glu He Val Ser Ala Ser Ser Leu 
100 105 110 

tac ggc gga acg tat aat tta ttt teg att acg ttg cca aag eta ggg 
Tyr Gly Gly Thr Tyr Asn Leu Phe Ser He Thr Leu Pro Lys Leu Gly 
115 120 125 

gta aac gtc cgt ttc gtt gat cca teg gac cca gaa aac ttc aaa gca 
Val Asn Val Arg Phe Val Asp Pro Ser Asp Pro Glu Asn Phe Lys Ala 
130 135 140 



eg att act gaa aag acg aaa gee att ttc get gag teg att gga aac 
He Thr Glu Lys Thr Lys Ala He Phe Ala Glu Ser He Gly Asn 
150 155 160 



cct aag gga gac gtg tta gat att gaa gcg gtg gcg aaa gtt gca cac 

Pro Lys Gly Asp Val Leu Asp He Glu Ala Val Ala Lys Val Ala His 

165 ' 170 175 

gat cat cac ctt ccc etc att gtc gat aac acg ttt cca age cca tat 

Asp His His Leu Pro Leu He Val Asp Asn Thr Phe Pro Ser Pro Tyr 

180 185 190 

ttg ctt caa ccg ata aag cac ggc gca gac att gtt gtg cat tea gca 

Leu Leu Gin Pro He Lys His Gly Ala Asp He Val Val His Ser Ala 

195 200 205 



aca aaa ttt ate ggt ggt cat ggg acg teg ata gga ggg ate att gtc 
Thr Lys Phe He Gly Gly His Gly Thr Ser He Gly Gly He He Val 
210 215 220 

gat gga ggg acg ttt gat tgg gcg aaa acg gat cga tat cca ggg eta 
Asp Gly Gly Thr Phe Asp Trp Ala Lys Thr Asp Arg Tyr Pro Gly Leu 
225 230 235 240 



M/43128 



96 



144 



192 



240 



288 



336 



384 



432 



480 



528 



576 



624 



672 



720 



MetY 



aca aca cct gat ccg agt tac cac ggt gtt gta tat aca gat gcg gtc 768 

Thr Thr Pro Asp Pro Ser Tyr His Gly Val Val Tyr Thr Asp Ala Val 
245 250 255 

ggt cca att get tat att att aaa gcg cgt gtt cag eta ttg cgt gac 816 

Gly Pro lie Ala Tyr lie He Lys Ala Arg Val Gin Leu Leu Arg Asp 
260 265 270 

atg ggg gca gec ata teg cca ttt aac teg ttt tta ctg ttg caa ggg 864 

Met Gly Ala Ala He Ser Pro Phe Asn Ser Phe Leu Leu Leu Gin Gly 
275 280 285 

ttg gaa acg ttg cat tta egg atg gag aga cat agt gaa aat gee tac 912 

Leu Glu Thr Leu His Leu Arg Met Glu Arg His Ser Glu Asn Ala Tyr 
290 295 300 

aaa gta gca gag ttc ctt gag caa cat caa gcg gtc gaa teg gtg age 960 

Lys Val Ala Glu Phe Leu Glu Gin His Gin Ala Val Glu Ser Val Ser 

305 310 315 320 



c tct gga ctg cca tec cat cca tec tac cca tta gcg aaa aaa tac 1008 
Ser Gly Leu Pro Ser His Pro Ser Tyr Pro Leu Ala Lys Lys Tyr 
325 330 335 




tta cct aaa ggc caa ggg get ate tta acg ttc gag gta aag ggc ggc 1056 
Leu Pro Lys Gly Gin Gly Ala He Leu Thr Phe Glu Val Lys Gly Gly 
340 345 350 

gtt gaa gca gga aag aaa etc att cat teg gtc cag eta ttc tec cac 1104 
Val Glu Ala Gly Lys Lys Leu He His Ser Val Gin Leu Phe Ser His 
355 360 365 

ctt gee aac gta ggt gat tea aaa teg ttg ate ate cat cct gca age 1152 
Leu Ala Asn Val Gly Asp Ser Lys Ser Leu He He His Pro Ala Ser 
370 375 380 

acg ace cac caa cag etc teg gaa gca gaa cag cga gac gca gga gtg 12 00 

Thr Thr His Gin Gin Leu Ser Glu Ala Glu Gin Arg Asp Ala Gly Val 
385 390 395 400 

a cct ggg atg ate aga ctt teg gta gga acc gaa teg att cat gat 124 8 

r Pro Gly Met He Arg Leu Ser Val Gly Thr Glu Ser He His Asp 
405 410 415 

att ate acc gat etc aaa cag gcg att gag gcg agt caa gcg taa 1293 
He He Thr Asp Leu Lys Gin Ala He Glu Ala Ser Gin Ala 
420 425 430 



<210> 8 

<211> 430 

<212> PRT 

<213> Bacillus halodurans 



<400> 8 

Met Asn His Glu Asn Gin Trp Gin Leu Glu Thr Lys Ala Val His Ser 
15 10 15 
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16 



Gly Gin Glu lie Asp Pro Thr Thr Leu Ser Arg Ala Val Pro Leu Tyr 
20 25 30 



Gin Thr Thr Ser Tyr Gly Phe Lys Asp Thr Asp His Ala Ala Asn Leu 
35 40 45 



Phe Ser Leu Ser Glu Phe Gly Asn lie Tyr Thr Arg Leu Met Asn Pro 
50 55 60 



Thr Thr Asp Val Phe Glu Lys Arg Val Ala Ala Leu Glu Gly Gly Ala 
65 70 75 80 




Ala Ala Leu Ala Thr Ala Ser Gly Gin Ala Ala He Thr Tyr Ser He 
85 90 95 



eu Asn He Ala Glu Ala Gly Asp Glu He Val Ser Ala Ser Ser Leu 
100 105 110 



Tyr Gly Gly Thr Tyr Asn Leu Phe Ser He Thr Leu Pro Lys Leu Gly 
115 120 125 



Val Asn Val Arg Phe Val Asp Pro Ser Asp Pro Glu Asn Phe Lys Ala 
130 135 140 



Ala He Thr Glu Lys Thr Lys Ala He Phe Ala Glu Ser He Gly Asn 
145 150 155 160 




Pro Lys Gly Asp Val Leu Asp He Glu Ala Val Ala Lys Val Ala His 
165 170 175 



sp His His Leu Pro Leu He Val Asp Asn Thr Phe Pro Ser Pro Tyr 
180 185 190 



Leu Leu Gin Pro He Lys His Gly Ala Asp He Val Val His Ser Ala 
195 200 205 



Thr Lys Phe He Gly Gly His Gly Thr Ser He Gly Gly He He Val 
210 215 220 



Asp Gly Gly Thr Phe Asp Trp Ala Lys Thr Asp Arg Tyr Pro Gly Leu 
225 230 235 240 



Thr Thr Pro Asp Pro Ser Tyr His Gly Val Val Tyr Thr Asp Ala Val 
245 250 255 



Gly Pro He Ala Tyr He He Lys Ala Arg Val Gin Leu Leu Arg Asp 

M/43128 MetY 
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260 265 270 



Met Gly Ala Ala He Ser Pro Phe Asn Ser Phe Leu Leu Leu Gin Gly 
275 280 285 

Leu Glu Thr Leu His Leu Arg Met Glu Arg His Ser Glu Asn Ala Tyr 
290 295 300 

Lys Val Ala Glu Phe Leu Glu Gin His Gin Ala Val Glu Ser Val Ser 
305 310 315 320 

Tyr Ser Gly Leu Pro Ser His Pro Ser Tyr Pro Leu Ala Lys Lys Tyr 
325 330 335 

Leu Pro Lys Gly Gin Gly Ala He Leu Thr Phe Glu Val Lys Gly Gly 
340 345 350 



Val Glu Ala Gly Lys Lys Leu He His Ser Val Gin Leu Phe Ser His 
355 360 365 

Leu Ala Asn Val Gly Asp Ser Lys Ser Leu He He His Pro Ala Ser 
370 375 380 

Thr Thr His Gin Gin Leu Ser Glu Ala Glu Gin Arg Asp Ala Gly Val 
385 390 395 ~ 400 

Thr Pro Gly Met He Arg Leu Ser Val Gly Thr Glu Ser He His Asp 
405 410 415 

£le He Thr Asp Leu Lys Gin Ala He Glu Ala Ser Gin Ala 
420 425 430 

<210> 9 

<211> 1203 

<212> DNA 

<213> Bacillus stearothermophilus 




<220> 

<221> CDS 

<222> (1) . . (1203) 

<223> 



M/43128 




<400> 9 

atg teg tat gta ttc cgc gac age 
Met Ser Tyr Val Phe Arg Asp Ser 
1 5 

ttg aaa gag gaa ggt ttt att tat 
Leu Lys Glu Glu Gly Phe lie Tyr 
20 



18 




gag cac gcg gec aat ttg ttt ggt 
Glu His Ala Ala Asn Leu Phe Gly 
10 15 

acg cgc att atg aat cca acg aac 
Thr Arg lie Met Asn Pro Thr Asn 
25 30 



i: 



gac gtg ttc gaa aag egg ate gcg gcg ctt gaa ggc ggc att ggg gcg 

Asp Val Phe Glu Lys Arg lie Ala Ala Leu Glu Gly Gly lie Gly Ala 
35 40 45 

etc gcg ctg tea teg ggg cag gcg gcg gtg ttt tat teg ate ate aac 

Leu Ala Leu Ser Ser Gly Gin Ala Ala Val Phe Tyr Ser lie lie Asn 
50 55 60 

ate gee teg gcg ggc gat gaa ate gtc teg tct teg tec att tac ggc 

lie Ala Ser Ala Gly Asp Glu lie Val Ser Ser Ser Ser He Tyr Gly 
65 70 75 80 




a acg tac aac ttg ttc gec cat acg ctg cgc aag ttc ggc att acg 
ly Thr Tyr Asn Leu Phe Ala His Thr Leu Arg Lys Phe Gly He Thr 
85 90 95 

gtg aag ttt gtc gat ccg tec gac ccc gaa aac ttt gag egg gcg ate 
Val Lys Phe Val Asp Pro Ser Asp Pro Glu Asn Phe Glu Arg Ala He 
100 105 110 

ace gac aaa acg aaa gec ttg ttt gcg gaa acg ate ggc aac ccg aaa 
Thr Asp Lys Thr Lys Ala Leu Phe Ala Glu Thr He Gly Asn Pro Lys 
115 120 125 

aac gat gtg ttg gac att gaa gcg gtg gee gac ate gec cat cgc cat 
Asn Asp Val Leu Asp He Glu Ala Val Ala Asp He Ala His Arg His 
130 135 140 

gee att ccg etc att gtc gac aac acg gtg gee agt cca tac tta ttg 
Ala He Pro Leu He Val Asp Asn Thr Val Ala Ser Pro Tyr Leu Leu 

1145 150 155 160 

g ccg att gaa ttc ggc gec gat ate gtc gtc cac tea gcg acg aag 
g Pro He Glu Phe Gly Ala Asp He Val Val His Ser Ala Thr Lys 
165 170 175 

ttc ate ggc ggg cac ggc aat teg ate ggc ggt gtg att gtg gac age 
Phe He Gly Gly His Gly Asn Ser He Gly Gly Val He Val Asp Ser 
180 185 190 

ggc aag ttt gac tgg aaa ggg age ggc aag ttt ccg gag ttc ace gag 
Gly Lys Phe Asp Trp Lys Gly Ser Gly Lys Phe Pro Glu Phe Thr Glu 
195 200 205 

cca gac cca age tac cac ggt ttg gtg tat gtg gac gee gtc ggc gaa 
Pro Asp Pro Ser Tyr His Gly Leu Val Tyr Val Asp Ala Val Gly Glu 
210 215 220 

gcg gcg tac ate acg aaa gcg cgc ate cag etc ttg cgc gat ttg gga 
Ala Ala Tyr He Thr Lys Ala Arg He Gin Leu Leu Arg Asp Leu Gly 
225 230 235 240 

gcg gcg ttg teg ccg ttt aat gcg ttt ttg ctt ttg caa ggg ttg gag 
Ala Ala Leu Ser Pro Phe Asn Ala Phe Leu Leu Leu Gin Gly Leu Glu 
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96 

144 
192 
240 
288 
336 
384 
432 
480 
528 
576 
624 
672 
720 
768 
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19 



245 



250 



255 



acg etc cat ttg 
Thr Leu His Leu 
260 



egg atg cag cgc cat age gaa aac gec ctt gee gtc 
Arg Met Gin Arg His Ser Glu Asn Ala Leu Ala Val 
265 270 



816 



gec aag ttt tta 
Ala Lys Phe Leu 
275 



gaa gag gaa gaa gcg gtc gaa teg gtc aat tac cca 
Glu Glu Glu Glu Ala Val Glu Ser Val Asn Tyr Pro 
280 285 



864 



999 ctt ccg age 
Gly Leu Pro Ser 
290 



cat ccg teg cat gaa ctg gcg aaa aaa tat ttg cca 
His Pro Ser His Glu Leu Ala Lys Lys Tyr Leu Pro 
295 300 



912 



aac ggg caa gga 
Asn Gly Gin Gly 
305 



gcg ate gtc acg ttt gaa ate aaa ggc ggc gtc gaa 
Ala He Val Thr Phe Glu He Lys Gly Gly Val Glu 
310 315 320 



960 




gec ggc aaa aaa 
Ala Gly Lys Lys 



ac ate ggc gat 
Asn He Gly Asp 
340 



ctg ate gac teg gtc aaa ctg ttc tct cat ttg gee 1008 

Leu He Asp Ser Val Lys Leu Phe Ser His Leu Ala 
325 330 335 

teg aaa teg etc ate ate cac ccg gee age aca acg 1056 

Ser Lys Ser Leu He He His Pro Ala Ser Thr Thr 
345 350 



cac gag cag ctg 
His Glu Gin Leu 
355 



age cca gat gaa cag ctg tec gee ggc gtc ace cca 
Ser Pro Asp Glu Gin Leu Ser Ala Gly Val Thr Pro 
360 365 



1104 



ggc ctt gtg cgt 
Gly Leu Val Arg 
370 



ctg tec gtc ggc aca gaa gcg ate gac gac att ttg 
Leu Ser Val Gly Thr Glu Ala He Asp Asp He Leu 
375 380 



1152 



gac gac ttg cgc 
Asp Asp Leu Arg 
385 



caa gee att cgc caa age cag acg gtg ggg gtg aag 
Gin Ala He Arg Gin Ser Gin Thr Val Gly Val Lys 
390 395 400 



1200 



tag 



0> 10 
<211> 400 



1203 



<212> PRT 
<213> Bacillus 



stearothermophilus 



<400> 10 

Met Ser Tyr Val Phe Arg Asp Ser Glu His Ala Ala Asn Leu Phe Gly 
1 5 10 15 



Leu Lys Glu Glu Gly Phe He Tyr Thr Arg He Met Asn Pro Thr Asn 
20 25 30 



Asp Val Phe Glu Lys Arg He Ala Ala Leu Glu Gly Gly He Gly Ala 
35 40 45 
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Leu Ala Leu Ser Ser Gly Gin Ala Ala Val Phe Tyr Ser lie lie Asn 
50 55 60 



lie Ala Ser Ala Gly Asp Glu He Val Ser Ser Ser Ser He Tyr Gly 
65 70 75 80 



Gly Thr Tyr Asn Leu Phe Ala His Thr Leu Arg Lys Phe Gly He Thr 
85 90 95 



Val Lys Phe Val Asp Pro Ser Asp Pro Glu Asn Phe Glu Arg Ala He 
100 105 110 



• 



Thr Asp Lys Thr Lys Ala Leu Phe Ala Glu Thr He Gly Asn Pro Lys 
115 120 125 



n Asp Val Leu Asp He Glu Ala Val Ala Asp He Ala His Arg His 
130 135 140 



Ala He Pro Leu He Val Asp Asn Thr Val Ala Ser Pro Tyr Leu Leu 
145 150 155 160 



Arg Pro He Glu Phe Gly Ala Asp He Val Val His Ser Ala Thr Lys 
165 170 175 



Phe He Gly Gly His Gly Asn Ser He Gly Gly Val He Val Asp Ser 
180 185 190 




Gly Lys Phe Asp Trp Lys Gly Ser Gly Lys Phe Pro Glu Phe Thr Glu 
195 200 205 



o Asp Pro Ser Tyr His Gly Leu Val Tyr Val Asp Ala Val Gly Glu 
210 215 220 



Ala Ala Tyr He Thr Lys Ala Arg He Gin Leu Leu Arg Asp Leu Gly 
225 230 235 240 



Ala Ala Leu Ser Pro Phe Asn Ala Phe Leu Leu Leu Gin Gly Leu Glu 
245 250 255 



Thr Leu His Leu Arg Met Gin Arg His Ser Glu Asn Ala Leu Ala Val 
260 265 270 



Ala Lys Phe Leu Glu Glu Glu Glu Ala Val Glu Ser Val Asn Tyr Pro 
275 280 285 
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Gly Leu Pro Ser His Pro Ser His Glu Leu Ala Lys Lys Tyr Leu Pro 
290 295 300 



Asn Gly Gin Gly Ala lie Val Thr Phe Glu lie Lys Gly Gly Val Glu 
305 310 ■ 315 320 



Ala Gly Lys Lys Leu lie Asp Ser Val Lys Leu Phe Ser His Leu Ala 
325 330 335 



Asn lie Gly Asp Ser Lys Ser Leu lie He His Pro Ala Ser Thr Thr 
340 345 350 



His Glu Gin Leu Ser Pro Asp Glu Gin Leu Ser Ala Gly Val Thr Pro 
355 360 365 



y Leu Val Arg Leu Ser Val Gly Thr Glu Ala He Asp Asp He Leu 
370 375 380 



Asp Asp Leu Arg Gin Ala He Arg Gin Ser Gin Thr Val Gly Val Lys 
385 390 395 400 



<210> 11 

<211> 1290 

<212> DNA 

<213> Chlorobium tepidum 

<220> 

21> CDS 

22> (1) - . (1290) 
<223> 



<400> 11 

atg agt gag gat aac acc ttc egg ttc gag acc ttg cag gtt cac gec 4 8 

Met Ser Glu Asp Asn Thr Phe Arg Phe Glu Thr Leu Gin Val His Ala 
15 10 15 

ggg cag gag cct gat ccg gtg acc gga teg cgc gec gtg ccc att tac 96 
Gly Gin Glu Pro Asp Pro Val Thr Gly Ser Arg Ala Val Pro He Tyr 
20 25 30 

cag acc acc tec tac gtg ttc gag aac gec gag cac ggc get gac ctg 144 
Gin Thr Thr Ser Tyr Val Phe Glu Asn Ala Glu His Gly Ala Asp Leu 
35 40 45 

ttc gcg ctt cgc aag gcg ggc aat ate tac acg cgc ctg atg aac ccg 192 
Phe Ala Leu Arg Lys Ala Gly Asn He Tyr Thr Arg Leu Met Asn Pro 

M/43128 MetY 





50 55 60 

acc acc gac gtg etc gaa aag cgc atg gcg gcg etc gaa ggg ggc aag 240 
Thr Thr Asp Val Leu Glu Lys Arg Met Ala Ala Leu Glu Gly Gly Lys 
65 70 75 80 

gcg gee etc ggc gtg gcg age ggc cac teg gcg cag ttc ate get att 288 
Ala Ala Leu Gly Val Ala Ser Gly His Ser Ala Gin Phe lie Ala He 
85 90 95 

gee acc ate tgc cag get gga gac aac att gtg tea teg age tat etc 336 
Ala Thr He Cys Gin Ala Gly Asp Asn He Val Ser Ser Ser Tyr Leu 
100 105 HO 

tac ggc ggc acc tac aac cag ttc aag gtc gee ttc aag cgc etc qqc 384 
Tyr Gly Gly Thr Tyr Asn Gin Phe Lys Val Ala Phe Lys Arg Leu Gly 
115 120 125 

ate gag gtg agg ttc gtg gat ggc aac gat cag gag gcg ttc cgc aag 432 
lie Glu Val Arg Phe Val Asp Gly Asn Asp Gin Glu Ala Phe Arg Lys 
* 130 135 140 

tt ate gac gag aac acg aaa gcg etc tac atg gag tec age ggc aat 480 
Ala lie Asp Glu Asn Thr Lys Ala Leu Tyr Met Glu Ser Ser Gly Asn 
145 150 155 160 

ccg gcg ttc cat gtg ccc gat ttc gac get ate geg aag att gee cgt 528 
Pro Ala Phe His Val Pro Asp Phe Asp Ala He Ala Lys He Ala Arg 
165 170 * 175 

gag aac ggc att ccg ctg ate gtc gat aac ace ttt ggc tgc gcg ggc 576 
Glu Asn Gly He Pro Leu He Val Asp Asn Thr Phe Gly Cys Ala Gly 
"0 185 190 

tat etc tgc cgt ccc att gat cac ggc gcg teg ate gtg gtc gag teg 624 
Tyr Leu Cys Arg Pro He Asp His Gly Ala Ser He Val Val Glu Ser 
195 200 205 

gee ace aag tgg ate ggc ggg cac ggc acc teg atg ggc ggc ate ate 672 
Ala Thr Lys Trp He Gly Gly His Gly Thr Ser Met Gly Gly He He 
210 215 220 



720 



768 



c gat gee gga acg ttc gac tgg ggc aac ggc aag ttt ccg etc ttt 
Val Asp Ala Gly Thr Phe Asp Trp Gly Asn Gly Lys Phe Pro Leu Phe 
225 230 235 240 

acc gag cca teg gaa ggc tat cae ggc ctg aaa ttc tac gaa gcg gtc 
Thr Glu Pro Ser Glu Gly Tyr His Gly Leu Lys Phe Tyr Glu Ala Val 
245 250 255 

ggc gag ctg gee ttt ate ate egg gcg egg gte gag gga ctg egg gat 816 
Gly Glu Leu Ala Phe He He Arg Ala Arg Val Glu Gly Leu Arg Asp 
260 265 270 

ttc ggc ccg gcg ate age ccg ttc aac tec ttc atg ctg ttg cag gga 
Phe Gly Pro Ala He Ser Pro Phe Asn Ser Phe Met Leu Leu Gin Gly 
275 280 285 

ctt gaa acg etc teg ctt cgc gtg cag cgc cac etc gac aac acg ctt 
Leu Glu Thr Leu Ser Leu Arg Val Gin Arg His Leu Asp Asn Thr Leu 
290 295 300 

gaa ctg gee cgc tgg etc gaa agg cac gat gcg gtt gcg tgg gtg aac 960 
M/43128 MetY 



864 



912 



23 

Glu Leu Ala Arg Trp Leu Glu Arg His Asp Ala Val Ala Trp Val Asn 
305 310 315 320 

Zl* ni° r tC 2?* a9C Cat CC9 aCa CaC 9CC Cta 9 ca aaa aaa tat 1008 
Tyr Pro Gly Leu Glu Ser His Pro Thr His Ala Leu Ala Lys Lys Tyr 

325 330 335 

etc acg cat ggc ttc ggc tgc gtg ctg act ttc ggc gtg aag qqt ggt 1056 
Leu Thr His Gly Phe Gly Cys Val Leu Thr Phe Sly Va! Ly! lly Ify 
340 345 * Y 

tat gaa aac gcg gtg aag ttc ate gac age gtg aag ctg gcg age cac 1104 
Tyr Glu Asn Ala Val Lys Phe lie Asp Ser Val Lys Leu Ala Ser His 
355 360 365 

ctg gec aac gtg ggt gat gca aaa acg etc gtc att cat ccg gca teg li 52 
Leu Ala Asn Val Gly Asp Ala Lys Thr Leu Val He His Pro Ala Ser 
370 375 380 " 



ac 1 

• 



I acg acg cac cag cag etc age gee gag gaa cag gta teg gcg ggc gtc 1200 
*hr Thr His Gin Gin Leu Ser Ala Glu Glu Gin Val Ser 111 III vll 
5 390 395 400 

ace gee gat atg gtg cgc gtg teg gtt ggt ate gag eat ate gat gac 1248 
Thr Ala Asp Met Val Arg Val Ser Val Gly He Glu His He Asp Asp 
405 410 415 



ate aag get gat ttc age cag get ttc gag aat tta gca tga 
He Lys Ala Asp Phe Ser Gin Ala Phe Glu Asn Leu Ala 
420 425 



<210> 12 

<211> 429 

<212> PRT 

<213> Chlorobium tepidum 




00> 12 

Met Ser Glu Asp Asn Thr Phe Arg Phe Glu Thr Leu Gin Val His Ala 

Gly Gin Glu Pro Asp Pro Val Thr Gly Ser Arg Ala Val Pro He Tyr 
20 25 30 

Gin Thr Thr Ser Tyr Val Phe Glu Asn Ala Glu His Gly Ala Asp Leu 
35 40 45 

Phe Ala Leu Arg Lys Ala Gly Asn He Tyr Thr Arg Leu Met Asn Pro 
50 55 60 

Thr Thr Asp Val Leu Glu Lys Arg Met Ala Ala Leu Glu Gly Gly Lys 
65 70 75 8 £ 



1290 
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Ala Ala Leu Gly Val Ala Ser Gly His Ser Ala Gin Phe He Ala He 
85 90 95 



Ala Thr He Cys Gin Ala Gly Asp Asn He Val Ser Ser Ser Tyr Leu 
100 105 110 



Tyr Gly Gly Thr Tyr Asn Gin Phe Lys Val Ala Phe Lys Arg Leu Gly 
115 120 125 



He Glu Val Arg Phe Val Asp Gly Asn Asp Gin Glu Ala Phe Arg Lys 
130 135 140 




Ala He Asp Glu Asn Thr Lys Ala Leu Tyr Met Glu Ser Ser Gly Asn 
145 150 155 160 



o Ala Phe His Val Pro Asp Phe Asp Ala He Ala Lys He Ala Arg 
165 170 175 



Glu Asn Gly He Pro Leu He Val Asp Asn Thr Phe Gly Cys Ala Gly 
180 185 190 



Tyr Leu Cys Arg Pro He Asp His Gly Ala Ser He Val Val Glu Ser 
195 200 205 



Ala Thr Lys Trp He Gly Gly His Gly Thr Ser Met Gly Gly He He 
210 215 220 



Val Asp Ala Gly Thr Phe Asp Trp Gly Asn Gly Lys Phe Pro Leu Phe 
225 230 235 240 



Glu Pro Ser Glu Gly Tyr His Gly Leu Lys Phe Tyr Glu Ala Val 
245 250 255 



Gly Glu Leu Ala Phe He He Arg Ala Arg Val Glu Gly Leu Arg Asp 
260 265 270 



Phe Gly Pro Ala He Ser Pro Phe Asn Ser Phe Met Leu Leu Gin Gly 
275 280 285 



Leu Glu Thr Leu Ser Leu Arg Val Gin Arg His Leu Asp Asn Thr Leu 
290 295 300 



Glu Leu Ala Arg Trp Leu Glu Arg His Asp Ala Val Ala Trp Val Asn 
305 310 315 320 



Tyr Pro Gly Leu Glu Ser His Pro Thr His Ala Leu Ala Lys Lys Tyr 
325 330 335 
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Leu Thr His Gly Phe Gly Cys Val Leu Thr Phe Gly Val Lys Gly Gly 
340 . 345 * 350 

Tyr Glu Asn Ala Val Lys Phe He Asp Ser Val Lys Leu Ala Ser His 
355 360 365 

Leu Ala Asn Val Gly Asp Ala Lys Thr Leu Val He His Pro Ala Ser 
370 375 380 

Thr Thr His Gin Gin Leu Ser Ala Glu Glu Gin Val Ser Ala Gly Val 
385 390 395 400 




Thr Ala Asp Met Val Arg Val Ser Val Gly He Glu His He Asp Asp 
405 410 415 



e Lys Ala Asp Phe Ser Gin Ala Phe Glu Asn Leu Ala 
420 425 



<210> 13 

<211> 1281 

<212> DNA 

<213> Lactococcus lactis 




<220> 

<221> CDS 

22> (1)..(1281) 
23> 



<400> 13 

atg act aat cac aat tat aaa ttc gac act ttg caa gtc cat gca gga 4 8 

Met Thr Asn His Asn Tyr Lys Phe Asp Thr Leu Gin Val His Ala Gly 

1 5 10 15 

caa gtc cct gat cct gtc acg ggt tea cgc gec gtt ccg etc tat caa 96 
Gin Val Pro Asp Pro Val Thr Gly Ser Arg Ala Val Pro Leu Tyr Gin 
20 25 30 

aca act tct ttc gtt ttt aac aat tea gac cat gec gaa get cgt ttt 144 
Thr Thr Ser Phe Val Phe Asn Asn Ser Asp His Ala Glu Ala Arg Phe 
35 40 45 

get tta caa gat cct gga get att tat tea cgt tta gga aat cca acc 192 
Ala Leu Gin Asp Pro Gly Ala He Tyr Ser Arg Leu Gly Asn Pro Thr 
50 55 60 



M/43128 
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aac gat gtt ttt gaa gca cgc ate gca get ctt gaa ggt gga agt gca 
Asn Asp val Phe Glu Ala Arg lie Ala Ala Leu Glu Gly Gly Ser Ala 
65 70 75 " 80 

gec ctt ggt gtt ggt tct ggc tea gee get att ace tat gee ate ttg 
Ala Leu Gly Val Gly Ser Gly Ser Ala Ala He Thr Tyr Ala He Leu 
85 90 95 

aat ate get aca gtc ggt gat aat att gtt tec gca agt ace ctt tat 
Asn He Ala Thr Val Gly Asp Asn He Val Ser Ala Ser Thr Leu Tyr 
100 105 HO 

ggt gga ace tat cac ctt ttt tct ggg act tta cca aaa tat gga att 
Gly Gly Thr Tyr His Leu Phe Ser Gly Thr Leu Pro Lys Tyr Gly He 
115 120 125 




165 170 



175 



190 



ttt aaa cca ttt gaa cat ggt get aat gta att gtt cat tea gca acg 
Phe Lys Pro Phe Glu His Gly Ala Asn Val He Val His Ser Ala Thr 
19 5 200 205 




[C gga aac ttt gat tgg gca aat ggt aat ttt cct gat ttt aca caa 
Gly Gly Asn Phe Asp Trp Ala Asn Gly Asn Phe Pro Asp Phe Thr Gin 
225 230 235 



240 



get tta tea cct ttt cat tct tgg ctt ttc tta cag ggg eta gaa aca 
Ala Leu Ser Pro Phe His Ser Trp Leu Phe Leu Gin Gly Leu Glu Thr 
27 5 280 285 

etc tea etc egg gta gaa cgt cac ate tec aat act aaa aag att gta 
Leu Ser Leu Arg Val Glu Arg His He Ser Asn Thr Lys Lys He Val 
290 295 300 
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240 



288 



336 



384 



aca act aaa ttt gtc aat cca gat gac ccg aag aat ttt gaa gag geg 432 
Thr Thr Lys Phe Val Asn Pro Asp Asp Pro Lys Asn Phe Glu Glu Ala 
13 ° 135 140 

t gat gaa aaa acc aaa get att tat tat gaa act ttg ggc aat ccg 480 

He Asp Glu Lys Thr Lys Ala He Tyr Tyr Glu Thr Leu Gly Asn Pro 
145 150 155 160 

gga aat aat gtg att gat tat gat gee att ggt caa att get aaa aaa 

Gly Asn Asn Val He Asp Tyr Asp Ala He Gly Gin He Ala Lys Lys 



528 



cat gga att ccc gtt att gtt gat gca acg ttt act acc cct gtg acc 576 
His Gly He Pro Val He Val Asp Ala Thr Phe Thr Thr Pro Val Thr 
180 185 



624 



aaa ttc att ggc ggt cat ggt act tct att ggt gga gtc ate gtt gat 672 
Lys Phe He Gly Gly His Gly Thr Ser He Gly Gly Val He Val Asp 
^ 210 215 220 



720 



get gat gaa age tac aat ggg att aaa ttt gee gaa ttg ggt gaa att 768 
Ala Asp Glu Ser Tyr Asn Gly He Lys Phe Ala Glu Leu Gly Glu He 
245 250 255 

get ttt gtg act egg gtt aga get att tta tta cgt gat acg ggt gcg 816 
Ala Phe Val Thr Arg Val Arg Ala He Leu Leu Arg Asp Thr Gly Ala 
260 265 270 



864 



912 



MetY 



27 

gaa ttt tta gac aat cat cct aag gtg gaa ctt gtt aac cat cct ctg 960 

Glu Phe Leu Asp Asn His Pro Lys Val Glu Leu Val Asn His Pro Leu 
305 310 . 315 320 

ctt gaa agt aat tec tat cat gcg etc tat cag aaa tat tat cca aaa 1008 
Leu Glu Ser Asn Ser Tyr His Ala Leu Tyr Gin Lys Tyr Tyr Pro Lys 
325 330 335 

gat get gga tct ate ttt acc ttt gaa etc aaa gac aaa gat gag aaa 1056 
Asp Ala Gly Ser lie Phe Thr Phe Glu Leu Lys Asp Lys Asp Glu Lys 
340 345 350 

aaa gcg cgt gat ttg att gat cat ctt gaa att ttc tea ctt eta gee 1104 
Lys Ala Arg Asp Leu lie Asp His Leu Glu lie Phe Ser Leu Leu Ala 
355 360 365 

aac gtt gga gat acc aaa tea ttg gee att cat cct get teg acc act 1152 
Asn Val Gly Asp Thr Lys Ser Leu Ala lie His Pro Ala Ser Thr Thr 
370 375 380 




ac cag cag ctg aat gec gaa gaa ctt get agt gca ggg att tec aaa 
'is Gin Gin Leu Asn Ala Glu Glu Leu Ala Ser Ala Gly lie Ser Lys 
85 390 395 400 



get gat tta gag caa gca tta gaa aaa ata taa 
Ala Asp Leu Glu Gin Ala Leu Glu Lys lie 

425 






420 


<210> 


14 


<211> 


426 


<212> 


PRT 


^213> 


Lactococcus lactis 



<400> 14 

Met Thr Asn His Asn Tyr Lys Phe Asp Thr Leu Gin Val His Ala Gly 
1 5 10 15 



Gin Val Pro Asp Pro Val Thr Gly Ser Arg Ala Val Pro Leu Tyr Gin 
20 25 30 



Thr Thr Ser Phe Val Phe Asn Asn Ser Asp His Ala Glu Ala Arg Phe 
35 4.0 45 



Ala Leu Gin Asp Pro Gly Ala He Tyr Ser Arg Leu Gly Asn Pro Thr 
50 55 60 



1200 



gga acc att cga tta teg gtt ggt att gaa gat gta act gac ttg att 1248 
Gly Thr He Arg Leu Ser Val Gly He Glu Asp Val Thr Asp Leu He 
405 410 415 



1281 



Asn Asp Val Phe Glu Ala Arg He Ala Ala Leu Glu Gly Gly Ser Ala 
M/43128 



MetY 



28 



65 



70 



75 



80 





Ala Leu Gly Val Gly Ser Gly Ser Ala Ala He Thr Tyr Ala He Leu 
85 90 " 95 



Asn He Ala Thr Val Gly Asp Asn He Val Ser Ala Ser Thr Leu Tyr 
100 105 110 



Gly Gly Thr Tyr His Leu Phe Ser Gly Thr Leu Pro Lys Tyr Gly He 
115 120 125 



Thr Thr Lys Phe Val Asn Pro Asp Asp Pro Lys Asn Phe Glu Glu Ala 
130 135 140 



lie Asp Glu Lys Thr Lys Ala He Tyr Tyr Glu Thr Leu Gly Asn Pro 
5 150 155 " 160 



Gly Asn Asn Val He Asp Tyr Asp Ala He Gly Gin He Ala Lys Lys 
165 170 " 175 



His Gly He Pro Val He Val Asp Ala Thr Phe Thr Thr Pro Val Thr 
180 185 190 



Phe Lys Pro Phe Glu His Gly Ala Asn Val He Val His Ser Ala Thr 
195 200 205 



Lys Phe He Gly Gly His Gly Thr Ser He Gly Gly Val He Val Asp 
210 215 220 



gly Gly Asn Phe Asp Trp Ala Asn Gly Asn Phe Pro Asp Phe Thr Gin 
5 230 235 240 



Ala Asp Glu Ser Tyr Asn Gly He Lys Phe Ala Glu Leu Gly Glu He 
245 250 255 



Ala Phe Val Thr Arg Val Arg Ala He Leu Leu Arg Asp Thr Gly Ala 
260 265 270 



Ala Leu Ser Pro Phe His Ser Trp Leu Phe Leu Gin Gly Leu Glu Thr 
275 280 285 



Leu Ser Leu Arg Val Glu Arg His He Ser Asn Thr Lys Lys He Val 
290 295 300 



Glu Phe Leu Asp Asn His Pro Lys Val Glu Leu Val Asn His Pro Leu 
305 310 315 320 



M/43128 




29 

Leu Glu Ser Asn Ser Tyr His Ala Leu Tyr Gin Lys Tyr Tyr Pro Lys 
325 330 " 335 

Asp Ala Gly Ser He Phe Thr Phe Glu Leu Lys Asp Lys Asp Glu Lys 
340 345 3 50 

Lys Ala Arg Asp Leu He Asp His Leu Glu He Phe Ser Leu Leu Ala 
355 360 365 



Asn Val Gly Asp Thr Lys Ser Leu Ala He His Pro Ala Ser Thr Thr 
370 375 380 

His Gin Gin Leu Asn Ala Glu Glu Leu Ala Ser Ala Gly He Ser Lys 
385 390 395 400 

y Thr He Arg Leu Ser Val Gly He Glu Asp Val Thr Asp Leu He 
405 410 415 

Ala Asp Leu Glu Gin Ala Leu Glu Lys He 
420 425 



<210> 15 

<211> 1173 

<212> DNA 

<213> Synechococcus sp. 

<220> 

1> CDS 

2> (1)..(1173) 
<223> 



<400> 15 

atg tct cag cgt ttc gaa acc etc cag ctg cat gec ggc cag tct cca 
Met Ser Gin Arg Phe Glu Thr Leu Gin Leu His Ala Gly Gin Ser Pro 
1 5 10 15 




48 



gac teg gec acc aat gec aga gcg gtg ccg att tat cag acc age tec 96 
Asp Ser Ala Thr Asn Ala Arg Ala Val Pro He Tyr Gin Thr Ser Ser 
20 25 30 

tac gtc ttc aac gac gec gag cac ggc gee aac ctg ttt gga ctg aag 144 
Tyr Val Phe Asn Asp Ala Glu His Gly Ala Asn Leu Phe Gly Leu Lys 
35 40 45 

gaa ttc ggc aac ate tac acc cgt ctg atg aac ccg acg acg gat gtg 192 
Glu Phe Gly Asn He Tyr Thr Arg Leu Met Asn Pro Thr Thr Asp Val 



M/43128 



MetY 




50 55 60 

ttc gag aag egg gtg gcg gec ctg gaa ggg ggt gtg gec gcg ctg gec 

Phe Glu Lys Arg Val Ala Ala Leu Glu Gly Gly Val Ala Ala Leu Ala 
65 70 75 80 



aca 
Thr 


gee 
Ala 


tec ggt 
Ser Gly 


cag 
Gin 
85 


teg 
Ser 


get 
Ala 


cag 
Gin 


ttc 
Phe 


ctg 
Leu 
90 


gcg 
Ala 


ate 
He 


acg 
Thr 


aat 
Asn 


tgc 
Cys 
95 


cag 
Gin 


gca 
Ala 


ggg gat 
Gly Asp 
100 


aac 
Asn 


ttt 
Phe 


gtg 
Val 


tec 
Ser 


acg 
Thr 
105 


teg 
Ser 


ttc 
Phe 


ctt 
Leu 


tac ggc 
Tyr Gly 
110 


ggc 
Gly 


tac 
Tyr 


aac 
Asn 


cag 
Gin 
115 


ttc 
Phe 


aaa 
Lys 


gtg 
Val 


caa 
Gin 


ttc 
Phe 
120 


ccc 
Pro 


egg 
Arg 


ctg 
Leu 


ggc 

Gly 


ate 
He 
125 


gac 
Asp 


gtg 
Val 


ttc get gat ggc 
Phe Ala Asp Gly 
A ^ 130 


gac 
Asp 


gac 
Asp 


gtg 
Val 
135 


gag 
Glu 


age 
Ser 


ttt 
Phe 


get 
Ala 


gcg 
Ala 
14 0 


cag 
Gin 


ate 
He 


gac 
Asp 


^J^Pka acc aaa 

Lys Thr Lys 
145 


ggc 
Gly 


etc 
Leu 


tac 
Tyr 
150 


gtc 
Val 


gaa 
Glu 


gcg 
Ala 


atg 
Met 


ggc 
Gly 
155 


aat 
Asn 


cca cgc 
Pro Arg 


ttc 
Phe 


ate 
He 


ccc gat 
Pro Asp 


ttc 
Phe 


gag 
Glu 
165 


ggc 
Gly 


etc 
Leu 


tea 
Ser 


gee 
Ala 


ctg 
Leu 
170 


get 
Ala 


aaa 
Lys 


gag cgc 
Glu Arg 


ggc 
Gly 
175 


cca 
Pro 


ttg 
Leu 


ate 
He 


gtg 
Val 
180 


gac 
Asp 


aac 
Asn 


acc ttg gga 
Thr Leu Gly 
185 


get 
Ala 


tgc 
Cys 


ggt 
Gly 


gee 
Ala 


ctg 
Leu 
190 


atg 
Met 


ccg 
Pro 


ate 
He 


gat 
Asp 
195 


cat 
His 


ggc 

Gly 


gcg 
Ala 


gat 
Asp 


gtg 
Val 
200 


gtg 
Val 


gtg 
Val 


gaa 
Glu 


age 
Ser 


gee 
Ala 
205 


acc 
Thr 


aag 
Lys 


att 

• 


ggc ggc cat 

Gly Gly His 
210 


ggc 
Gly 


acc 
Thr 


age 
Ser 
215 


etc 
Leu 


ggt 
Gly 


ggc 
Gly 


gtg 

Val 


ate 
He 
220 


gtt 

Val 


gat 
Asp 


gee 
Ala 


Thr 
225 


ttt 
Phe 


aac 
Asn 


tgg 
Trp 


ggc 
Gly 


aat 
Asn 
230 


ggc aaa 
Gly Lys 


ttc 
Phe 


ccg 
Pro 


ctg 
Leu 
235 


ctg 
Leu 


age 
Ser 


caa 
Gin 


ccc 
Pro 


gcg get 
Ala Ala 


tat 
Tyr 


cac 
His 


ggc 
Gly 
245 


ctt 
Leu 


gtg 
Val 


cac 
His 


tgg 
Trp 


gat 
Asp 
250 


gec 
Ala 


ttc 
Phe 


ggc ttc 
Gly Phe 


ggc 

Gly 
255 


gac 
Asp 


gtc 
Val 


tgc 
Cys 


aag 
Lys 
260 


atg 
Met 


ctg 
Leu 


gga gtg 
Gly Val 


ccg 
Pro 
265 


gac 
Asp 


aac 
Asn 


cgc 
Arg 


aac 
Asn 


gtc 
Val 
270 


gee 
Ala 


gec 
Ala 


ctg cga 
Leu Arg 
275 


gee 
Ala 


egg 
Arg 


gtc 
Val 


gag ggt eta 
Glu Gly Leu 
280 


egg 
Arg 


gac 
Asp 


tgg 
Trp 


ggt 

Gly 
285 


ccg 
Pro 


gcg 
Ala 


agt 
Ser 


ccc 
Pro 
290 


ttc 
Phe 


aat 
Asn 


age 
Ser 


ttc 
Phe 


ctg 
Leu 
295 


ctg 
Leu 


ctg 
Leu 


caa 
Gin 


ggt 

Gly 


eta 
Leu 
300 


gaa 
Glu 


acc 
Thr 


etc 
Leu 


ctg 


egg 


gtg 


gag 


cgc 


cac 


a eg 


gag 


aac 


gee 


atg 


gcg 


ctg 


gee 


acc 



160 



240 



M/43128 



240 



288 



336 



384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



912 



960 

MetY 



31 



Leu Arg Val Glu Arg His Thr Glu Asn Ala Met Ala Leu Ala Thr Trp 
305 310 315 320 

eta gca acg cac ccc aat gtg gag cat gtg age tac cca ggc ctg age 
Leu Ala Thr His Pro Asn Val Glu His Val Ser Tyr Pro Gly Leu Ser 
325 330 335 



999 9^t gec aaa acc tgg tga 
" ^ly Asp Ala Lys Thr Trp 
5 390 



<210> 


16 


<211> 


390 


<212> 


PRT 


<213> 


Synechococcus sp * 


<400> 


16 


Met Ser Gin Arg Phe Glu 
1 5 



• 



10 15 



p Ser Ala Thr Asn Ala Arg Ala Val Pro He Tyr Gin Thr Ser Ser 
20 25 30 



Tyr Val Phe Asn Asp Ala Glu His Gly Ala Asn Leu Phe Gly Leu Lys 
35 40 45 

Glu Phe Gly Asn He Tyr Thr Arg Leu Met Asn Pro Thr Thr Asp Val 
50 55 60 

Phe Glu Lys Arg Val Ala Ala Leu Glu Gly Gly Val Ala Ala Leu Ala 
65 ^ 70 75 80 

Thr Ala Ser Gly Gin Ser Ala Gin Phe Leu Ala He Thr Asn Cys Met 
85 90 95 

Gin Ala Gly Asp Asn Phe Val Ser Thr Ser Phe Leu Tyr Gly Gly Thr 
100 105 HO 



1008 



age gat ccg tat cac gca get gee aag aaa tac ctg acg ggc egg ggc 1056 
Ser Asp Pro Tyr His Ala Ala Ala Lys Lys Tyr Leu Thr Gly Arg Gly 
340 345 350 

atg gga tgc atg ctg atg ttc teg etc aag ggc ggt tac gac gat gca 1104 
Met Gly Cys Met Leu Met Phe Ser Leu Lys Gly Gly Tyr Asp Asp Ala 
355 360 365 

gtc cgt ttc ate aac age ctt caa ctg gee agt cac etc gee aat gtg 1152 
Val Arg Phe He Asn Ser Leu Gin Leu Ala Ser His Leu Ala Asn Val 
370 375 380 



1173 



M/43128 



MetY 




32 



Tyr Asn Gin Phe Lys Val Gin Phe Pro Arg Leu Gly He Asp Val Arg 
115 120 125 

Phe Ala Asp Gly Asp Asp Val Glu Ser Phe Ala Ala Gin lie Asp Asp 
130 135 140 



Lys Thr Lys Gly Leu Tyr Val Glu Ala Met Gly Asn Pro Arg Phe Asn 

145 ' 150 155 160 

He Pro Asp Phe Glu Gly Leu Ser Ala Leu Ala Lys Glu Arg Gly He 

165 170 175 



Pro Leu He Val Asp Asn Thr Leu Gly Ala Cys Gly Ala Leu Met Arg 
180 185 190 

o He Asp His Gly Ala Asp Val Val Val Glu Ser Ala Thr Lys Trp 
195 200 205 

He Gly Gly His Gly Thr Ser Leu Gly Gly Val He Val Asp Ala Gly 
210 215 220 

Thr Phe Asn Trp Gly Asn Gly Lys Phe Pro Leu Leu Ser Gin Pro Ser 
225 ^ 230 235 240 

Ala Ala Tyr His Gly Leu Val His Trp Asp Ala Phe Gly Phe Gly Ser 
245 250 255 

Asp Val Cys Lys Met Leu Gly Val Pro Asp Asn Arg Asn Val Ala Phe 
260 265 270 

a Leu Arg Ala Arg Val Glu Gly Leu Arg Asp Trp Gly Pro Ala Val 
275 280 285 

Ser Pro Phe Asn Ser Phe Leu Leu Leu Gin Gly Leu Glu Thr Leu Ser 
290 295 300 

Leu Arg Val Glu Arg His Thr Glu Asn Ala Met Ala Leu Ala Thr Trp 
305 " 310 315 320 

Leu Ala Thr His Pro Asn Val Glu His Val Ser Tyr Pro Gly Leu Ser 
325 330 335 

Ser Asp Pro Tyr His Ala Ala Ala Lys Lys Tyr Leu Thr Gly Arg Gly 
340 345 350 

Met Gly Cys Met Leu Met Phe Ser Leu Lys Gly Gly Tyr Asp Asp Ala 
355 360 365 




M/43128 



MetY 



Val Arg Phe lie Asn Ser Leu Gin Leu Ala Ser His Leu Ala Asn Val 
370 375 380 

Gly Asp Ala Lys Thr Trp 
385 390 

<210> 17 

<211> 1314 

<212> DNA 

<213> Emericella nidulans 

•220> 
221> CDS 
<222> (1)..(1314) 
<223> 



<400> 17 

atg tec gac cct tea ccg aaa cgt ttc gag acc etc cag etc cat gcg 
Met Ser Asp Pro Ser Pro Lys Arg Phe Glu Thr Leu Gin Leu His Ala 
15 10 15 

ggc cag gag cct gac cct gca act aat tec egg get gtc cca ate tat 
Gly Gin Glu Pro Asp Pro Ala Thr Asn Ser Arg Ala Val Pro lie Tyr 
20 25 30 



gcg aca acg tec tac acc ttc aat gac tec gca cac ggc gee agg ctt 
a Thr Thr Ser Tyr Thr Phe Asn Asp Ser Ala His Gly Ala Arg Leu 
35 40 45 



ttt ggc etc aaa gag ttt ggc aat att tac age cga att atg aat ccc 
Phe Gly Leu Lys Glu Phe Gly Asn He Tyr Ser Arg He Met Asn Pro 
50 55 60 

aca gtc gat gtc ttc gaa aaa cgt att get gca etc gag gga ggt gtc 
Thr Val Asp Val Phe Glu Lys Arg He Ala Ala Leu Glu Gly Gly Val 
65 70 75 80 

get gcg gtg get gee tea tct ggc cag gca gee cag ttc atg gee ate 
Ala Ala Val Ala Ala Ser Ser Gly Gin Ala Ala Gin Phe Met Ala He 
85 90 95 

tct get eta gee cat get ggt gac aat ate gtt tec aca agt aat ttg 
Ser Ala Leu Ala His Ala Gly Asp Asn He Val Ser Thr Ser Asn Leu 
100 105 110 

tat ggt ggt aca tac aat cag ttt aag gtc ctt ttc cca cga ctg gga 
Tyr Gly Gly Thr Tyr Asn Gin Phe Lys Val Leu Phe Pro Arg Leu Gly 
115 120 125 



M/43128 



34 

att acc aca aaa ttc gtg cag gga gac aaa gca gag gac att gcc gcc 432 
lie Thr Thr Lys Phe Val Gin Gly Asp Lys Ala Glu Asp lie Ala Ala 
130 135 140 

get ate gat gac cgt acc aag gcc gtc tac gtc gag aca ata gga aac 480 
Ala lie Asp Asp Arg Thr Lys Ala Val Tyr Val Glu Thr lie Gly Asn 
145 150 * 155 160 



cct cgc tac aat gtg ccc gac ttt gag gtc att gca aaa gta gcc cat 
Pro Arg Tyr Asn Val Pro Asp Phe Glu Val lie Ala Lys Val Ala His 

1 nA - 



165 170 175 





528 



gag aag gga att ccc ctt gtg gtt gac aac acc ttc ggt gcc gga ggc 576 
Glu Lys Gly lie Pro Leu Val Val Asp Asn Thr Phe Gly Ala Gly Gly 
180 185 190 

tac ttt gtt cga ccc att gaa cat ggc gcc gac att gtc gtg cac agt 624 
Tyr Phe Val Arg Pro lie Glu His Gly Ala Asp He Val Val His Ser 
195 200 205 

ca act aaa tgg att gga ggt cat ggc aca acc ate gga ggc gtt gtc 672 
a Thr Lys Trp He Gly Gly His Gly Thr Thr He Gly Gly Val Val 
210 215 220 

gtg gac age ggc aaa ttc gac tgg ggc aag aac gcc gcg egg ttt cct 720 
Val Asp Ser Gly Lys Phe Asp Trp Gly Lys Asn Ala Ala Arg Phe Pro 
225 230 235 240 

cag ttc acg cag cct tct gaa ggt tac cac ggg ttg aac ttc tgg gag 768 
Gin Phe Thr Gin Pro Ser Glu Gly Tyr His Gly Leu Asn Phe Trp Glu 
245 250 255 

acc ttc ggc ccc att gcc ttc gcg att cgt gtc egg gtc gaa ate ctg 816 
Thr Phe Gly Pro He Ala Phe Ala He Arg Val Arg Val Glu He Leu 
260 265 270 

cgc gac etc ggg tec gcg ctg aac cct ttc gcc gcg cag cag etc ate 864 
Arg Asp Leu Gly Ser Ala Leu Asn Pro Phe Ala Ala Gin Gin Leu He 
275 280 285 

g ggt ctg gaa acc eta age ttg cgc get gag cgt cat get tec aac 912 
u Gly Leu Glu Thr Leu Ser Leu Arg Ala Glu Arg His Ala Ser Asn 
290 295 300 

get ctg gcc etc gcc aac tgg eta aag aag aat gat cac gtc age tgg 960 
Ala Leu Ala Leu Ala Asn Trp Leu Lys Lys Asn Asp His Val Ser Trp 
305 310 315 ^ 320 

gtt tct tac gtg ggc eta gaa gag cac tec age cac gaa gtt gca aag 1008 
Val Ser Tyr Val Gly Leu Glu Glu His Ser Ser His Glu Val Ala Lys 
325 330 335 

aag tac etc aag cgt ggg ttc ggc ggt gtc eta tec ttt ggt gtc aag 1056 
Lys Tyr Leu Lys Arg Gly Phe Gly Gly Val Leu Ser Phe Gly Val Lys 
340 345 350 

gg fc gag gca gcc gtc ggt age cag gtt gtc gac aac ttt aag etc ate 1104 
Gly Glu Ala Ala Val Gly Ser Gin Val Val Asp Asn Phe Lys Leu He 
355 360 365 

tec aat eta gca aat gtt gga gac tec aag acc etc gcg att cac ccc 1152 
Ser Asn Leu Ala Asn Val Gly Asp Ser Lys Thr Leu Ala He His Pro 
370 375 380 

M/43128 MetY 



35 



tgg age acc act cac gag cag ttg acc gac cag gag cga ate gat tct 
Trp Ser Thr Thr His Glu Gin Leu Thr Asp Gin Glu Arg He Asn Ser 
385 390 395 ^ 400 

ggt gtt acg gaa gat gec ate cgc ate tct gtc ggc act gag cac ate 
Gly Val Thr Glu Asp Ala He Arg He Ser Val Gly Thr Glu His He 
405 410 415 

gac gac ate ate gee gac ttt gaa cag tea ttt gca gcg acc ttc aaa 
Asp Asp He He Ala Asp Phe Glu Gin Ser Phe Ala Ala Thr Phe Lys 
420 425 430 

gtt gtc egg agt get tag 
Val Val Arg Ser Ala 
435 



1200 



1248 



1296 



1314 




<210> 18 

11> 437 

12 > PRT 

<213> Emericella nidulans 



<400> 18 

Met Ser Asp Pro Ser Pro Lys Arg Phe Glu Thr Leu Gin Leu His Ala 
1 5 10 is 

Gly Gin Glu Pro Asp Pro Ala Thr Asn Ser Arg Ala Val Pro He Tyr 
20 25 " 30 




Ala Thr Thr Ser Tyr Thr Phe Asn Asp Ser Ala His Gly Ala Arg Leu 
35 40 45 



e Gly Leu Lys Glu Phe Gly Asn He Tyr Ser Arg He Met Asn Pro 
50 55 60 



Thr Val Asp Val Phe Glu Lys Arg He Ala Ala Leu Glu Gly Gly Val 
65 70 75 80 

Ala Ala Val Ala Ala Ser Ser Gly Gin Ala Ala Gin Phe Met Ala He 
85 90 95 

Ser Ala Leu Ala His Ala Gly Asp Asn He Val Ser Thr Ser Asn Leu 
100 105 110 



Tyr Gly Gly Thr Tyr Asn Gin Phe Lys Val Leu Phe Pro Arg Leu Gly 
115 120 125 



He Thr Thr Lys Phe Val Gin Gly Asp Lys Ala Glu Asp He Ala Ala 
M/43128 
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36 



130 



135 



140 



Ala lie Asp Asp Arg Thr Lys Ala Val Tyr Val Glu Thr lie Gly Asn 
145 150 155 



160 




Pro Arg Tyr Asn Val Pro Asp Phe Glu Val He Ala Lys Val Ala His 
165 170 175 

Glu Lys Gly He Pro Leu Val Val Asp Asn Thr Phe Gly Ala Gly Gly 
180 185 190 

Tyr Phe Val Arg Pro He Glu His Gly Ala Asp He Val Val His Ser 
195 200 205 

Ala Thr Lys Trp He Gly Gly His Gly Thr Thr He Gly Gly Val Val 
210 215 220 



Val Asp Ser Gly Lys Phe Asp Trp Gly Lys Asn Ala Ala Arg Phe Pro 
225 230 235 240 

Gin Phe Thr Gin Pro Ser Glu Gly Tyr His Gly Leu Asn Phe Trp Glu 
245 250 255 

Thr Phe Gly Pro lie Ala Phe Ala He Arg Val Arg Val Glu He Leu 
260 265 270 

Arg Asp Leu Gly Ser Ala Leu Asn Pro Phe Ala Ala Gin Gin Leu He 
275 280 285 




u Gly Leu Glu Thr Leu Ser Leu Arg Ala Glu Arg His Ala Ser Asn 
290 295 300 



Ala Leu Ala Leu Ala Asn Trp Leu Lys Lys Asn Asp His Val Ser Trp 
305 310 315 



320 



Val Ser Tyr Val Gly Leu Glu Glu His Ser Ser His Glu Val Ala Lys 
325 330 335 

Lys Tyr Leu Lys Arg Gly Phe Gly Gly Val Leu Ser Phe Gly Val Lys 
340 345 350 

Gly Glu Ala Ala Val Gly Ser Gin Val Val Asp Asn Phe Lys Leu He 
355 360 365 



Ser Asn Leu Ala Asn Val Gly Asp Ser Lys Thr Leu Ala He His Pro 
370 375 380 



M/43128 
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37 



Trp Ser Thr Thr His Glu Gin Leu Thr Asp Gin Glu Arg He Asp Ser 
385 390 395 ~ 400 

Gly Val Thr Glu Asp Ala He Arg He Ser Val Gly Thr Glu His He 
405 410 415 

Asp Asp He He Ala Asp Phe Glu Gin Ser Phe Ala Ala Thr Phe Lys 
420 425 430 



Val Val Arg Ser Ala 
435 



<210> 19 

<211> 1287 

12 > DNA 

<213> Bacteroides fragilis 

<220> 

<221> CDS 

<222> (1) . . (1287) 

<223> 



<400> 19 

atg gaa acg aaa aaa tta cat ttt gag act tta caa etc cat gtt gga 

Met Glu Thr Lys Lys Leu His Phe Glu Thr Leu Gin Leu His Val Gly 
5 10 15 

g gag act ccc gac ccg gca acc gat gcg cgt gec gta cct att tat 
Gin Glu Thr Pro Asp Pro Ala Thr Asp Ala Arg Ala Val Pro He Tyr 
20 . 25 30 



act cag gga gta ttg gag gaa cgc ate gca gca ctt gaa ggg gga gta 
Thr Gin Gly Val Leu Glu Glu Arg He Ala Ala Leu Glu Gly Gly Val 
65 70 75 80 



48 



96 



cag aca act tec tat gtg ttc egg gat teg gec cat gec gee gca cga 144 
Gin Thr Thr Ser Tyr Val Phe Arg Asp Ser Ala His Ala Ala Ala Arg 
35 40 45 

ttt gga ttg caa gac cct ggg aat att tat gga cga ctg acc aat tec 192 
Phe Gly Leu Gin Asp Pro Gly Asn He Tyr Gly Arg Leu Thr Asn Ser 
50 55 60 



240 



ggt ggg ctt gee gtg get tec gga get get gee gtg acc tat get ate 288 
Gly Gly Leu Ala Val Ala Ser Gly Ala Ala Ala Val Thr Tyr Ala He 
85 90 95 

gag aat ate acc cgt tec ggt gat cat att gtg get gec aag acc att 33 6 

M/43128 MetY 



38 



Glu Asn lie Thr Arg Ser Gly Asp His He Val Ala Ala Lys Thr He 
100 105 110 

tat ggg ggc aca tat aac ttg ctg gcg cat act ctg cct get tat gga 
Tyr Gly Gly Thr Tyr Asn Leu Leu Ala His Thr Leu Pro Ala Tyr Gly 
115 120 125 

gta acg acc act ttt gta gat ccg tec gat ctt ttt aat ttc gaa egg 
Val Thr Thr Thr Phe Val Asp Pro Ser Asp Leu Phe Asn Phe Glu Arg 
130 135 140 

gcg att cgt gaa aat aca aag gcg ata ttc att gaa act ctg gga aac 
Ala He Arg Glu Asn Thr Lys Ala He Phe He Glu Thr Leu Gly Asn 
145 150 155 160 

ccc aat tec aat att ate gat atg gat gee gta get gee att gec cat 
Pro Asn Ser Asn He He Asp Met Asp Ala Val Ala Ala He Ala His 
165 170 175 



aaa tat egg att ccg ctg att gtg gat aat act ttc ggt acg cct tac 
s Tyr Arg He Pro Leu He Val Asp Asn Thr Phe Gly Thr Pro Tyr 
180 185 190 




ctt ate cgt ccc att gag cac ggg gca gac att gtg gta cat tct gee 
Leu He Arg Pro He Glu His Gly Ala Asp He Val Val His Ser Ala 
195 200 205 

aca aaa ttc att ggc gga cac ggc agt teg ttg gga gga gtt att gtc 
Thr Lys Phe He Gly Gly His Gly Ser Ser Leu Gly Gly Val. He Val 
210 215 220 

gat tec ggt aaa ttt gac tgg gtt get tec ggt aaa ttc ccg caa ctg 
Asp Ser Gly Lys Phe Asp Trp Val Ala Ser Gly Lys Phe Pro Gin Leu 
225 230 235 240 

acc gag ccg gat gca agt tat cat ggg gta egg ttt gtc gat get gee 
Thr Glu Pro Asp Ala Ser Tyr His Gly Val Arg Phe Val Asp Ala Ala 
245 250 255 

ggg get get gee tac att gtc cgt ata cgt gee gtg ttg ctg cgc gat 
y Ala Ala Ala Tyr He Val Arg He Arg Ala Val Leu Leu Arg Asp 
260 265 , 270 

acg ggt get gee ate age ccg ttc aat get ttt ate ttg ctg caa ggg 
Thr Gly Ala Ala He Ser Pro Phe Asn Ala Phe He Leu Leu Gin Gly 
275 280 285 

ttg gag act ttg tct ttg cgt gta gaa egg cat gtg gec aat get ttg 
Leu Glu Thr Leu Ser Leu Arg Val Glu Arg His Val Ala Asn Ala Leu 
290 295 300 

aag gtt att gat ttt ctg gtg aac cat ccg aag gta gcg get gtt aat 
Lys Val He Asp Phe Leu Val Asn His Pro Lys Val Ala Ala Val Asn 
305 310 315 320 

cat cca tea ttg ccc ggt cat ccg gat cat gee ate tat caa cgt tat 
His Pro Ser Leu Pro Gly His Pro Asp His Ala He Tyr Gin Arg Tyr 
325 330 335 

ttt cct ggc ggg gca ggt tct ate ttc act ttc gag gta aag gga gga 
Phe Pro Gly Gly Ala Gly Ser He Phe Thr Phe Glu Val Lys Gly Gly 
340 345 350 
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384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



1056 
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39 




acg gag gaa gcg cag aag ttt ate gat agt ctg cag ata ttc tct ttg 
Thr Glu Glu Ala Gin Lys Phe lie Asp Ser Leu Gin lie Phe Ser Leu 
355 360 365 

ctg gec aat gtg gec gat gtg aag teg ctg gtg att cat ccg ggc act 
Leu Ala Asn Val Ala Asp Val Lys Ser Leu Val lie His Pro Gly Thr 
37 0 375 380 

f£ 3 C ^ C tCg ° a9 ttg aat gcg cag 9 a 9 ct 9 9 a 9 gaa cag ggg att 
Thr Thr Has Ser Gin Leu Asn Ala Gin Glu Leu Glu Glu Gin Gly lie 

385 390 395 400 

aaa ccc gga acg gtc aga ctt teg ata ggt acg gag cat att gag gac 
Lys Pro Gly Thr Val Arg Leu Ser lie Gly Thr Glu His He Glu Asp 
405 410 415 

att att gat gac tta cgt cag gca tta gag aaa att taa 
He He Asp Asp Leu Arg pin Ala Leu Glu Lys He 
420 425 



10> 20 

<211> 428 

<212> PRT 

<213> Bacteroides fragilis 



1104 



1152 



1200 



1248 



1287 



<400> 20 



Met Glu Thr Lys Lys Leu His Phe Glu Thr Leu Gin Leu His Val Gly 

1 5 10 - - 



15 



Gin Glu Thr Pro Asp Pro Ala Thr Asp Ala Arg Ala Val Pro lie Tyr 
2 0 25 ~ * 



30 




Thr Thr Ser Tyr Val Phe Arg Asp Ser Ala His Ala Ala Ala Arg 



40 



45 



Phe Gly Leu Gin Asp Pro Gly Asn lie Tyr Gly Arg Leu Thr Asn Ser 
50 55 60 



Thr Gin Gly Val Leu Glu Glu Arg He Ala Ala Leu Glu Gly Gly Val 
65 70 75 80 

Gly Gly Leu Ala Val Ala Ser Gly Ala Ala Ala Val Thr Tyr Ala He 
85 9° 95 

Glu Asn He Thr Arg Ser Gly Asp His He Val Ala Ala Lys Thr He 
100 105 no 

Tyr Gly Gly Thr Tyr Asn Leu Leu Ala His Thr Leu Pro Ala Tyr Gly 
115 120 125 
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Val Thr Thr Thr Phe Val Asp Pro Ser Asp Leu Phe Asn Phe Glu Arg 
130 135 140 

Ala He Arg Glu Asn Thr Lys Ala He Phe He Glu Thr Leu Gly Asn 
145 150 155 160 

Pro Asn Ser Asn He He Asp Met Asp Ala Val Ala Ala He Ala His 
165 170 175 

Lys Tyr Arg He Pro Leu He Val Asp Asn Thr Phe Gly Thr Pro Tyr 
180 185 190 




Leu He Arg Pro He Glu His Gly Ala Asp He Val Val His Ser Ala 
195 200 205 



hr Lys Phe He Gly Gly His Gly Ser Ser Leu Gly Gly Val He Val 
210 215 220 



Asp Ser Gly Lys Phe Asp Trp Val Ala Ser Gly Lys Phe Pro Gin Leu 

225 230 235 240 

Thr Glu Pro Asp Ala Ser Tyr His Gly Val Arg Phe Val Asp Ala Ala 

245 250 255 

Gly Ala Ala Ala Tyr He Val Arg He Arg Ala Val Leu Leu Arg Asp 

260 265 270 




Thr Gly Ala Ala He Ser Pro Phe Asn Ala Phe He Leu Leu Gin Gly 
275 280 285 



eu Glu Thr Leu Ser Leu Arg Val Glu Arg His Val Ala Asn Ala Leu 
290 295 300 



Lys Val He Asp Phe Leu Val Asn His Pro Lys Val Ala Ala Val Asn 

305 310 315 320 

His Pro Ser Leu Pro Gly His Pro Asp His Ala He Tyr Gin Arg Tyr 

325 330 335 

Phe Pro Gly Gly Ala Gly Ser He Phe Thr Phe Glu Val Lys Gly Gly 

340 345 350 



Thr Glu Glu Ala Gin Lys Phe He Asp Ser Leu Gin He Phe Ser Leu 
355 360 365 



Leu Ala Asn Val Ala Asp Val Lys Ser Leu Val He His Pro Gly Thr 
M/43128 
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370 375 380 




Thr Thr His Ser Gin Leu Asn Ala Gin Glu Leu Glu Glu Gin Gly He 
385 390 395 400 



Lys Pro Gly Thr Val Arg Leu Ser He Gly Thr Glu His He Glu Asp 
405 410 415 



He He Asp Asp Leu Arg Gin Ala Leu Glu Lys He 
420 425 



<210> 21 

<211> 1278 

<212> DNA 

13 > Pseudomonas aeruginosa 

<220> 

<221> CDS 

<222> (1) . . (1278) 

<223> 




<400> 21 

atg aaa ctg gaa acc ctg gcc gtc cac gcc ggc tac age cct gac ccg 48 
Met Lys Leu Glu Thr Leu Ala Val His Ala Gly Tyr Ser Pro Asp Pro 
15 10 15 

c acc cgc gcg gtg gcg gtg ccg ate tac cag acc acc tec tac gcc 96 
Ir Thr Arg Ala Val Ala Val Pro He Tyr Gin Thr Thr Ser Tyr Ala 
20 25 30 

ttc gac gac acc cag cat ggc gcc gac ctg ttc gac ctg aag gta ccg 144 
Phe Asp Asp Thr Gin His Gly Ala Asp Leu Phe Asp Leu Lys Val Pro 
35 40 45 

ggc aac ate tac aca egg ate atg aac ccc acc aac gac gta ctg gaa 192 
Gly Asn He Tyr Thr Arg He Met Asn Pro Thr Asn Asp Val Leu Glu 
50 55 60 

cag cgc gtc gcg gcg ctg gaa ggc ggg gtc ggg gcg ctg gcg gtg gcc 240 
Gin Arg Val Ala Ala Leu Glu Gly Gly Val Gly Ala Leu Ala Val Ala 
65 70 75 80 

teg ggg atg gcg gcc ate acc tac gcg ate cag acc gtc gcc gag gcc 2 88 

Ser Gly Met Ala Ala He Thr Tyr Ala He Gin Thr Val Ala Glu Ala 
85 90 95 

ggc gac aac ate gtc teg gtg gcc aag etc tac ggc ggc acc tac aac 33 6 

Gly Asp Asn He Val Ser Val Ala Lys Leu Tyr Gly Gly Thr Tyr Asn 
100 105 110 
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ctg ctg gcc cac acc ctg cca cgc ate ggc ate cag gcg cgc ttc gec 384 

Leu Leu Ala His Thr Leu fcro Arg He Gly He Gin Ala Arg Phe Ala 

115 120 125 

gcc cac gac gac gtc gcc gcc ctg gaa gcg ctg ate gac gag egg acc 432 

Ala His Asp Asp Val Ala Ala Leu Glu Ala Leu He Asp Glu Arg Thr 
130 135 140 

aag gcc gtg ttc tgc gaa acc ate ggc aac ccg gcg ggc aac ate ate 480 

Lys Ala Val Phe Cys Glu Thr He Gly Asn Pro Ala Gly Asn He He 
145 150 155 160 

gac ctg cag gca ctg gcc gac gcc get cac cgc cac ggc gtg cca ctg 528 

Asp Leu Gin Ala Leu Ala Asp Ala Ala His Arg His Gly Val Pro Leu 
165 170 175 

ate gtc gac aac acg gta gcc acc ccg gtg etc tgc egg ccg ttc gag 576 
He Val Asp Asn Thr Val Ala Thr Pro Val Leu Cys Arg Pro Phe Glu 
180 185 190 



c ggc gcc gac ate gtc gtg cac teg ctg acc aag tac atg ggc ggc 
Is Gly Ala Asp He Val Val His Ser Leu Thr Lys Tyr Met Gly Gly 
195 200 205 




624 



cac ggc acc age ate ggc ggg ate gtg gtc gac tec ggc aaa ttc gac 672 
His Gly Thr Ser He Gly Gly He Val Val Asp Ser Gly Lys Phe Asp 
210 215 220 

tgg gcg gcg aac aag teg cgc ttc ccg ctg ctg aac acg ccc gat ccg 720 
Trp Ala Ala Asn Lys Ser Arg Phe Pro Leu Leu Asn Thr Pro Asp Pro 
225 230 235 240 

tec tac cac ggc gtc acc tac acc gag gcc ttc gga ccc gcc gcc ttc 768 
Ser Tyr His Gly Val Thr Tyr Thr Glu Ala Phe Gly Pro Ala Ala Phe 
245 250 255 

ate ggc cgc tgc egg gtg gta ccg ctg cgc aac atg ggc gcg gcg etc 816 
He Gly Arg Cys Arg Val Val Pro Leu Arg Asn Met Gly Ala Ala Leu 
260 265 270 

g ccg ttc aac gcc ttc etc ate etc caa ggc ctg gag acc ctg gcg 864 
fer Pro Phe Asn Ala Phe Leu He Leu Gin Gly Leu Glu Thr Leu Ala 
275 280 285 

ctg cgc atg gag cgc cac tgc gac aac gcc etc gcc gtg gcc cgc tac 912 
Leu Arg Met Glu Arg His Cys Asp Asn Ala Leu Ala Val Ala Arg Tyr 
290 295 300 

ctg cag cag cat ccg cag gtg gcc tgg gtg aaa tac gcc ggc etc gcc 960 
Leu Gin Gin His Pro Gin Val Ala Trp Val Lys Tyr Ala Gly Leu Ala 
305 310 315 320 

gac aac ccc gag cac gcc ctg gcc egg cgc tac ctg ggg ggc cgc ccg 1008 
Asp Asn Pro Glu His Ala Leu Ala Arg Arg Tyr Leu Gly Gly Arg Pro 
325 330 335 

gcg gcg ate ctg tct ttc ggc ate cag ggc ggc age gcc gcc ggc gcg 1056 
Ala Ala He Leu Ser Phe Gly He Gin Gly Gly Ser Ala Ala Gly Ala 
340 345 350 

cgc ttc ate gac gcc ttg aag ctg gtg gtg egg ctg gtc aac ate ggc 1104 
Arg Phe He Asp Ala Leu Lys Leu Val Val Arg Leu Val Asn He Gly 
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355 360 365 

gac gcc aag tec ctg gec tgc cac ccg gcg age acc acc cac cgc cag 
Asp Ala Lys Ser Leu Ala Cys His Pro Ala Ser Thr Thr His Arg Gin 
370 375 380 

ttg aac gcg gag gaa ctg gcc cgc gcc gga gtc tec gac gac atg gtg 
Leu Asn Ala Glu Glu Leu Ala Arg Ala Gly Val Ser Asp Asp Met Val 
385 390 395 400 

egg ctg teg ate ggc ate gag cac ate gac gac ate etc gcc gac etc 
Arg Leu Ser lie Gly lie Glu His lie Asp Asp lie Leu Ala Asp Leu 
405 410 415 





420 


<210> 


22 


Kll> 


425 


<212> 


PRT 


<213> 


Pseudomonas 




<400> 22 

Met Lys Leu Glu Thr Leu Ala Val His Ala Gly Tyr Ser Pro Asp Pro 
15 10 15 



Thr Thr Arg Ala Val Ala Val Pro lie Tyr Gin Thr Thr Ser Tyr Ala 
20 25 30 



Phe Asp Asp Thr Gin His Gly Ala Asp Leu Phe Asp Leu Lys Val Pro 
35 40 45 



Gly Asn lie Tyr Thr Arg lie Met Asn Pro Thr Asn Asp Val Leu Glu 
50 55 60 

Gin Arg Val Ala Ala Leu Glu Gly Gly Val Gly Ala Leu Ala Val Ala 
65 ~ 70 75 80 

Ser Gly Met Ala Ala lie Thr Tyr Ala lie Gin Thr Val Ala Glu Ala 
85 90 95 



Gly Asp Asn lie Val Ser Val Ala Lys Leu Tyr Gly Gly Thr Tyr Asn 
100 105 110 



Leu Leu Ala His Thr Leu Pro Arg lie Gly lie Gin Ala Arg Phe Ala 
115 120 125 



1152 



1200 



1248 



gac cag gcc ctg gcc gcc gcc gca cgc tga 1278 
Asp Gin Ala Leu Ala Ala Ala Ala Arg 

425 
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Ala His Asp Asp Val Ala Ala Leu Glu Ala Leu He Asp Glu Arg Thr 
130 135 140 



Lys Ala Val Phe Cys Glu Thr He Gly Asn Pro Ala Gly Asn He He 
145 150 155 160 



Asp Leu Gin Ala Leu Ala Asp Ala Ala His Arg His Gly Val Pro Leu 
165 170 175 



He Val Asp Asn Thr Val Ala Thr Pro Val Leu Cys Arg Pro Phe Glu 
180 185 190 



His Gly Ala Asp He Val Val His Ser Leu Thr Lys Tyr Met Gly Gly 
195 200 205 



s Gly Thr Ser He Gly Gly He Val Val Asp Ser Gly Lys Phe Asp 
210 215 220 



Trp Ala Ala Asn Lys Ser Arg Phe Pro Leu Leu Asn Thr Pro Asp Pro 
225 230 235 240 



Ser Tyr His Gly Val Thr Tyr Thr Glu Ala Phe Gly Pro Ala Ala Phe 
245 250 255 



He Gly Arg Cys Arg Val Val Pro Leu Arg Asn Met Gly Ala Ala Leu 
260 265 270 



Ser Pro Phe Asn Ala Phe Leu He Leu Gin Gly Leu Glu Thr Leu Ala 
275 280 285 




u Arg Met Glu Arg His Cys Asp Asn Ala Leu Ala Val Ala Arg Tyr 
290 295 300 



Leu Gin Gin His Pro Gin Val Ala Trp Val Lys Tyr Ala Gly Leu Ala 
305 310 315 320 



Asp Asn Pro Glu His Ala Leu Ala Arg Arg Tyr Leu Gly Gly Arg Pro 
325 330 335 



Ala Ala He Leu Ser Phe Gly He Gin Gly Gly Ser Ala Ala Gly Ala 
340 345 350 



Arg Phe He Asp Ala Leu Lys Leu Val Val Arg Leu Val Asn He Gly 
355 360 365 



Asp Ala Lys Ser Leu Ala Cys His Pro Ala Ser Thr Thr His Arg Gin 
370 "* 375 380 
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Leu Asn Ala Glu Glu Leu Ala Arg Ala Gly Val Ser Asp Asp Met Val 
385 390 395 400 



Arg Leu Ser lie Gly lie Glu His lie Asp Asp lie Leu Ala Asp Leu 
405 410 415 

Asp Gin Ala Leu Ala Ala Ala Ala Arg 
420 425 

<210> 23 
<211> 1296 
<212> DNA 

<t213> Bordetella bronchi septica 
<220> 

<221> CDS 

<222> (1) . . (1296) 

<223> 



<400> 23 

atg age gaa ccg aac caa ccc ate tgg egg ctg gag ace ate gee gta 4 8 

Met Ser Glu Pro Asn Gin Pro He Trp Arg Leu Glu Thr He Ala Val 
15 10 15 



cat ggg ggc tac egg ccc gac ccg acc acg cgc gcg gtg gcg gtg ccg 96 
is Gly Gly Tyr Arg Pro Asp Pro Thr Thr Arg Ala Val Ala Val Pro 
20 25 30 



c tac cag acc gtg gee tat gcg ttc gac gac acc cag cat ggc gcg 144 
He Tyr Gin Thr Val Ala Tyr Ala Phe Asp Asp Thr Gin His Gly Ala 
35 40 45 

gac ctg ttc gac ctg aag gtg ccg ggc aat ate tac acc cgc ate atg 192 
Asp Leu Phe Asp Leu Lys Val Pro Gly Asn lie Tyr Thr Arg He Met 
50 55 60 

aac ccc acc acc gac gtg ctg gag cag cgc gtg gcg gcg ctg gaa tgc 24 0 

Asn Pro Thr Thr Asp Val Leu Glu Gin Arg Val Ala Ala Leu Glu Cys 
65 70 75 80 

ggc gtg gec gcg ctg gcg ctg gee tec ggc cag gcg gcg gtg acc tat 2 88 

Gly Val Ala Ala Leu Ala Leu Ala Ser Gly Gin Ala Ala Val Thr Tyr 
85 90 95 

gcg ate ctg acc ate gee gag gcg ggc gac aac ate gtg teg tec age 3 36 

Ala He Leu Thr He Ala Glu Ala Gly Asp Asn He Val Ser Ser Ser 
100 105 110 

acg ctg tat ggc ggc acg tac aac ctg ttc gec cac acg ctg ccg cag 3 84 

M/43128 MetY 



Thr Leu Tyr Gly Gly Thr Tyr Asn Leu Phe Ala His Thr Leu Pro Gin 
115 120 125 

tac ggc ate acg acc cgc ttc gec gat ccg cgc aac ctg get teg ttc 432 
Tyr Gly lie Thr Thr Arg Phe Ala Asp Pro Arg Asn Leu Ala Ser Phe 
130 135 140 



gag gcg ctg ate gac gag cgc acc aag gee att ttc gec gag teg gtg 

Glu Ala Leu He Asp Glu Arg Thr Lys Ala He Phe Ala Glu Ser Val 

145 150 155 160 

ggc aat ccg ctg ggc aac gtc acc gac ate gec gcg ctg gec gag ate 

Gly Asn Pro Leu Gly Asn Val Thr Asp lie Ala Ala Leu Ala Glu He 
165 170 175 




ctg cgc aat acc ggc gcg gec att teg ccg ttc aac gee ttc cag ate 
u Arg Asn Thr Gly Ala Ala He Ser Pro Phe Asn Ala Phe Gin He 
275 280 285 



aac teg gtc aag gtg gec ggg ttc ctg cgc gac cat ccc aag gtc gaa 
Asn Ser Val Lys Val Ala Gly Phe Leu Arg Asp His Pro Lys Val Glu 
305 310 315 320 

tgg gtc aac tat gec ggc ctg ccc gac cat gec gac cat gcg ctg gtg 
Trp Val Asn Tyr Ala Gly Leu Pro Asp His Ala Asp His Ala Leu Val 
325 330 335 

cgc aag tac atg ggc ggc aag gee ccc ggc ctg ttc act ttc ggc gtg 
Arg Lys Tyr Met Gly Gly Lys Ala Pro Gly Leu Phe Thr Phe Gly Val 
340 345 350 



480 



528 



gcg cac cgc cat ggc gtg ccg ctg ate gtc gac aac acg gtg ccg teg 576 
Ala His Arg His Gly Val Pro Leu He Val Asp Asn Thr Val Pro Ser 
180 185 190 



ccc tac ctg ctg cgc ccc ate gag cac ggc gec gac ate gtg gtg cag 624 
o Tyr Leu Leu Arg Pro lie Glu His Gly Ala Asp He Val Val Gin 
195 200 205 



672 



teg etc acc aag tac ctg ggc ggg cac ggc acc age ctg ggc ggg gee 
Ser Leu Thr Lys Tyr Leu Gly Gly His Gly Thr Ser Leu Gly Gly Ala 
210 215 220 

ate ate gat teg ggc aag ttt ccc tgg gee gag cac aag gcg cgc ttc 
He He Asp Ser Gly Lys Phe Pro Trp Ala Glu His Lys Ala Arg Phe 
225 ~ 230 235 240 

aag cgc ctg aac gag ccc gac gtg age tac cac ggc gtg gtc tac acc 
Lys Arg Leu Asn Glu Pro Asp Val Ser Tyr His Gly Val Val Tyr Thr 
245 250 255 

gag gcg ttc ggc gcg gcg gee tat ate ggc cgc gee cgc gtg gtg ccg 816 
Glu Ala Phe Gly Ala Ala Ala Tyr He Gly Arg Ala Arg Val Val Pro 
260 265 270 



720 



768 



864 



ctg cag ggc ate gag acg ctg gcg ctg cgc gtg gac cgc ate gtc gag 912 
Leu Gin Gly He Glu Thr Leu Ala Leu Arg Val Asp Arg He Val Glu 
290 295 300 



960 



1008 



1056 



aag ggc ggc cgc gag gec ggc gcg cgc ttc cag gac gee ttg cag ctg 1104 
Lys Gly Gly Arg Glu Ala Gly Ala Arg Phe Gin Asp Ala Leu Gin Leu 
355 360 365 
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47 

ttc acc cgc ctg gtg aac ate ggc gac gec aag teg ctg gec acg cac 1152 

Phe Thr Arg Leu Val Asn He Gly Asp Ala Lys Ser Leu Ala Thr His 

370 375 380 

ccg get tec acc acg cac cgc cag etc aac ccc gaa gag etc gaa aag 1200 

Pro Ala Ser Thr Thr His Arg Gin Leu Asn Pro Glu Glu Leu Glu Lys 
385 390 395 400 

gee ggc gtg cgc gag gaa acg gtg cgc ctg teg ate ggg ate gag cat 124 8 

Ala Gly Val Arg Glu Glu Thr Val Arg Leu Ser He Gly He Glu His 
405 410 415 

ate gac gac ctg ate gec gac ctg gaa cag gcg ctg gcg caa gtc tga 12 96 

He Asp Asp Leu He Ala Asp Leu Glu Gin Ala Leu Ala Gin Val 

420 425 430 



<210> 24 

<211> 431 

12 > PRT 

<213> Bordetella bronchi sept ica 

<400> 24 

Met Ser Glu Pro Asn Gin Pro He Trp Arg Leu Glu Thr He Ala Val 
1 5 10 15 



His Gly Gly Tyr Arg Pro Asp Pro Thr Thr Arg Ala Val Ala Val Pro 
20 25 30 



He Tyr Gin Thr Val Ala Tyr Ala Phe Asp Asp Thr Gin His Gly Ala 
35 40 45 



Leu Phe Asp Leu Lys Val Pro Gly Asn He Tyr Thr Arg He Met 
50 55 60 



Asn Pro Thr Thr Asp Val Leu Glu Gin Arg Val Ala Ala Leu Glu Cys 
65 70 75 80 



Gly Val Ala Ala Leu Ala Leu Ala Ser Gly Gin Ala Ala Val Thr Tyr 
85 90 95 



Ala He Leu Thr He Ala Glu Ala Gly Asp Asn He Val Ser Ser Ser 
100 105 110 



Thr Leu Tyr Gly Gly Thr Tyr Asn Leu Phe Ala His Thr Leu Pro Gin 
115 120 125 



Tyr Gly He Thr Thr Arg Phe Ala Asp Pro Arg Asn Leu Ala Ser Phe 
130 135 140 
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Glu Ala Leu lie Asp Glu Arg Thr Lys Ala He Phe Ala Glu Ser Val 
145 150 155 160 



Gly Asn Pro Leu Gly Asn Val Thr Asp He Ala Ala Leu Ala Glu He 
165 170 175 



Ala His Arg His Gly Val Pro Leu He Val Asp Asn Thr Val Pro Ser 
180 185 190 



Pro Tyr Leu Leu Arg Pro He Glu His Gly Ala Asp He Val Val Gin 
195 200 205 



• 



Ser Leu Thr Lys Tyr Leu Gly Gly His Gly Thr Ser Leu Gly Gly Ala 
210 215 220 




e He Asp Ser Gly Lys Phe Pro Trp Ala Glu His Lys Ala Arg Phe 
225 230 235 240 

Lys Arg Leu Asn Glu Pro Asp Val Ser Tyr His Gly Val Val Tyr Thr 
245 250 255 

Glu Ala Phe Gly Ala Ala Ala Tyr He Gly Arg Ala Arg Val Val Pro 
260 265 270 

Leu Arg Asn Thr Gly Ala Ala He Ser Pro Phe Asn Ala Phe Gin He 
275 280 285 

Leu Gin Gly He Glu Thr Leu Ala Leu Arg Val Asp Arg He Val Glu 
290 295 300 

n Ser Val Lys Val Ala Gly Phe Leu Arg Asp His Pro Lys Val Glu 
305 310 315 320 

Trp Val Asn Tyr Ala Gly Leu Pro Asp His Ala Asp His Ala Leu Val 
325 330 335 

Arg Lys Tyr Met Gly Gly Lys Ala Pro Gly Leu Phe Thr Phe Gly Val 
340 345 350 

Lys Gly Gly Arg Glu Ala Gly Ala Arg Phe Gin Asp Ala Leu Gin Leu 
355 360 365 

Phe Thr Arg Leu Val Asn He Gly Asp Ala Lys Ser Leu Ala Thr His 
370 375 380 

i 

Pro Ala Ser Thr Thr His Arg Gin Leu Asn Pro Glu Glu Leu Glu Lys 
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385 390 395 400 



Ala Gly Val Arg Glu Glu Thr Val Arg Leu Ser He Gly He Glu His 
405 410 415 



He Asp Asp Leu lie Ala Asp Leu Glu Gin Ala Leu Ala Gin Val 
420 425 430 



<210> 25 

<211> 1269 

<212> DNA 

<213> Nitrosomonas europaea 

20> 

<221> CDS 

<222> (1) . . (1269) 
<223> 



<400> 25 

atg aaa egg gaa aca etc gec att cat ggc ggt ttt gec ggc gat ccg 4 8 

Met Lys Arg Glu Thr Leu Ala He His Gly Gly Phe Ala Gly Asp Pro 
15 10 15 

cag act cat gca gtc gcg gtc ccc att tac cag acc acc age tac tat 96 
Gin Thr His Ala Val Ala Val Pro He Tyr Gin Thr Thr Ser Tyr Tyr 
20 25 30 

k t gat gat act cag cac ggg get gat ttg ttt gat ctg aag gtg cag 144 
Asp Asp Thr Gin His Gly Ala Asp Leu Phe Asp Leu Lys Val Gin 
35 40 45 

ggt aac ate tac aca cgc ate atg aac ccg act act get gtc ctg gaa 192 
Gly Asn He Tyr Thr Arg He Met Asn Pro Thr Thr Ala Val Leu Glu 
50 55 60 

gaa aga gtg gcg tta ctg gaa gga gga gtg gga gcg ctg gee atg get 240 
Glu Arg Val Ala Leu Leu Glu Gly Gly Val Gly Ala Leu Ala Met Ala 
65 70 75 80 

tec ggc atg gee gee att aca gee tgt gtg cag act ctg gee agg gcg 288 
Ser Gly Met Ala Ala He Thr Ala Cys Val Gin Thr Leu Ala Arg Ala 
85 90 95 

ggc gac aac att ate tec acc age cag gtt tac ggt ggc acc tat aat 3 36 

Gly Asp Asn He He Ser Thr Ser Gin Val Tyr Gly Gly Thr Tyr Asn 
100 105 110 

ttc ttt tgc cat acg. ttg ccc aat ctg ggt att gaa gtt cgc atg gtg 3 84 

Phe Phe Cys His Thr Leu Pro Asn Leu Gly He Glu Val Arg Met Val 
115 120 125 
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gat ggt cgt aat ccg gcc get ttt gec gat gec ate gat gac aat ace 432 
Asp Gly Arg Asn Pro Ala Ala Phe Ala Asp Ala lie Asp Asp Asn Thr 
130 135 140 

aga atg att tat tgc gag teg ate gga aat ccg gcc ggt aat gtg gtg 480 
Arg Met lie Tyr Cys Glu Ser lie Gly Asn Pro Ala Gly Asn Val Val 
145 150 155 160 

gat ate gcc gca ctg get gaa gtg gcg cat gca gcg ggc gtg ccg ctg 528 
Asp He Ala Ala Leu Ala Glu Val Ala His Ala Ala Gly Val Pro Leu 
165 170 175 

gta gtg gac aat ace gta cca ace ccg gtg ctt tgt cgt cct ttc gaa 576 
Val Val Asp Asn Thr Val Pro Thr Pro Val Leu Cys Arg Pro Phe Glu 
180 185 190 

cat ggt gcc gat ate gtc gtc cat gcg ctg ace aaa tac atg ggt ggt 624 
His Gly Ala Asp He Val Val His Ala Leu Thr Lys Tyr Met Gly Gly 
195 200 205 

c ggc ace age ate ggc gga ate ate gtg gat tec ggc aag ttc ccc 672 
is Gly Thr Ser He Gly Gly He He Val Asp Ser Gly Lys Phe Pro 
210 215 220 

tgg gaa ggc aac teg cgt ttt cca caa ttc aac caa cct gat ccc age 720 
Trp Glu Gly Asn Ser Arg Phe Pro Gin Phe Asn Gin Pro Asp Pro Ser 
225 230 235 240 

tat cac ggt gtg gtt tat gtg gat gca ttt ggt ccg get gcg ttt ate 768 
Tyr His Gly Val Val Tyr Val Asp Ala Phe Gly Pro Ala Ala Phe He 
245 250 255 

ggc cgt gcg cgt gtg gta ccg ttg cgc aac atg gga gcg gca att tea 816 
Gly Arg Ala Arg Val Val Pro Leu Arg Asn Met Gly Ala Ala He Ser 
260 265 270 

cct ttc aat tct ttt ctg att ctg caa ggt ate gaa ace ctg ccg ttg 864 
Pro Phe Asn Ser Phe Leu He Leu Gin Gly He Glu Thr Leu Pro Leu 



275 280 285 



|g atg gaa egg cat tgc ace aat gcg ctg gcg att gca cgt tat ctg 912 
Met Glu Arg His Cys Thr Asn Ala Leu Ala He Ala Arg Tyr Leu 
290 ~ 295 300 

caa agg cat ccc aaa gtc age tgg gtc aat ttt gcc ggc ctt gaa gat 960 
Gin Arg His Pro Lys Val Ser Trp Val Asn Phe Ala Gly Leu Glu Asp 
305 310 315 320 

aac cgt gat tac gca ctg gtg cag aaa tac atg gat ggc ggt att ccc 1008 
Asn Arg Asp Tyr Ala Leu Val Gin Lys Tyr Met Asp Gly Gly He Pro 
325 330 335 

tea teg att ctg agt ttt ggc ate aag ggc ggg cgc gag get tgt get 1056 
Ser Ser He Leu Ser Phe Gly He Lys Gly Gly Arg Glu Ala Cys Ala 
340 345 350 

cgc ttt atg gac aga ctg atg ctg ate aaa egg ctg gtc aac ate ggg 1104 
Arg Phe Met Asp Arg Leu Met Leu He Lys Arg Leu Val Asn He Gly 
355 360 365 

gat gcc aaa acg ctg gcc tgc cac ccg gcg acg acc acc cac cgt cag 1152 
Asp Ala Lys Thr Leu Ala Cys His Pro Ala Thr Thr Thr His Arg Gin 
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370 



375 



380 



etc aat gat gaa gaa ctg gca aaa gec ggt gtc agt get gat ctg gtg 
Leu Asn Asp Glu Glu Leu Ala Lys Ala Gly Val Ser Ala Asp Leu Val 
385 390 395 400 



1200 



cgt tta tgt gtc ggc ate gag cat att gac gat ctg att gee gat gta 
Arg Leu Cys Val Gly lie Glu His lie Asp Asp Leu lie Ala Asp Val 
405 410 415 



1248 



gag cag get ttc cag gat tag 
Glu Gin Ala Phe Gin Asp 



1269 





420 


<210> 


26 


<211> 


422 


<212> 


PRT 


1 


Ni t r o s omona s 



<400> 26 

Met Lys Arg Glu Thr Leu Ala lie His Gly Gly Phe Ala Gly Asp Pro 
15 10 15 



Gin Thr His Ala Val Ala Val Pro lie Tyr Gin Thr Thr Ser Tyr Tyr 
20 25 30 



Phe Asp Asp Thr Gin His Gly Ala Asp Leu Phe Asp Leu Lys Val Gin 
35 40 45 



£ly Asn lie Tyr Thr Arg lie Met Asn Pro Thr Thr Ala Val Leu Glu 
50 55 60 




Glu Arg Val Ala Leu Leu Glu Gly Gly Val Gly Ala Leu Ala Met Ala 
65 70 75 80 



Ser Gly Met Ala Ala lie Thr Ala Cys Val Gin Thr Leu Ala Arg Ala 
85 90 95 



Gly Asp Asn lie lie Ser Thr Ser Gin Val Tyr Gly Gly Thr Tyr Asn 
100 105 110 



Phe Phe Cys His Thr Leu Pro Asn Leu Gly lie Glu Val Arg Met Val 
115 120 125 



Asp Gly Arg Asn Pro Ala Ala Phe Ala Asp Ala He Asp Asp Asn Thr 
130 135 140 
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Arg Met lie Tyr Cys Glu Ser lie Gly Asn Pro Ala Gly Asri Val Val 
145 150 155 160 



Asp lie Ala Ala Leu Ala Glu Val Ala His Ala Ala Gly Val Pro Leu 
165 170 175 



Val Val Asp Asn Thr Val Pro Thr Pro Val Leu Cys Arg Pro Phe Glu 
180 185 190 



His Gly Ala Asp He Val Val His Ala Leu Thr Lys Tyr Met Gly Gly 
195 200 205 



His Gly Thr Ser He Gly Gly He He Val Asp Ser Gly Lys Phe Pro 
210 215 220 



Glu Gly Asn Ser Arg Phe Pro Gin Phe Asn Gin Pro Asp Pro Ser 
5 230 235 240 



Tyr His Gly Val Val Tyr Val Asp Ala Phe Gly Pro Ala Ala Phe He 
245 250 255 



Gly Arg Ala Arg Val Val Pro Leu Arg Asn Met Gly Ala Ala He Ser 
260 265 270 



Pro Phe Asn Ser Phe Leu He Leu Gin Gly He Glu Thr Leu Pro Leu 
275 280 285 



Arg Met Glu Arg His Cys Thr Asn Ala Leu Ala He Ala Arg Tyr Leu. 
290 295 300 




Arg His Pro Lys Val Ser Trp Val Asn Phe Ala Gly Leu Glu Asp 
310 315 320 



Asn Arg Asp Tyr Ala Leu Val Gin Lys Tyr Met Asp Gly Gly He Pro 
325 330 335 



Ser Ser He Leu Ser Phe Gly He Lys Gly Gly Arg Glu Ala Cys Ala 
340 345 350 



Arg Phe Met Asp Arg Leu Met Leu He Lys Arg Leu Val Asn He Gly 
355 360 365 



Asp Ala Lys Thr Leu Ala Cys His Pro Ala Thr Thr Thr His Arg Gin 
370 375 380 



Leu Asn Asp Glu Glu Leu Ala Lys Ala Gly Val Ser Ala Asp Leu Val 
385 390 395 400 



M/43128 



Arg Leu Cys Val Gly lie Glu His lie Asp Asp Leu lie Ala Asp Val 
405 410 415 



Glu Gin Ala Phe Gin Asp 
420 



<210> 27 

<211> 1281 

<212> DNA 

<213> Sinorhizobium meliloti 



20> 
221> CDS 
<222> (1) . . (1281) 
<223> 



<400> 27 

atg aaa gcc gga ccc gga ttc age acg ctt gca att cac gec ggg gec 48 
Met Lys Ala Gly Pro Gly Phe Ser Thr Leu Ala lie His Ala Gly Ala 
1 5 10 15 

cag ccc gat ccg acg acc ggt gcg egg gcg acg ccg ate tat cag acg 96 
Gin Pro Asp Pro Thr Thr Gly Ala Arg Ala Thr Pro lie Tyr Gin Thr 
20 25 30 

acc age ttc gtc ttc aac gac acg gat cat gcg gcc gca etc ttc ggc 144 
r Ser Phe Val Phe Asn Asp Thr Asp His Ala^Ala Ala Leu Phe Gly 
35 40 45 

etc cag caa ttc ggc aat ate tat acc cgc ate atg aat ccg acg cag 192 
Leu Gin Gin Phe Gly Asn lie Tyr Thr Arg lie Met Asn Pro Thr Gin 
50 55 60 

gcg gtg ctg gag gag egg ate gcg gcg etc gaa ggc ggg acc gcc ggg 240 
Ala Val Leu Glu Glu Arg lie Ala Ala Leu Glu Gly Gly Thr Ala Gly 
65 70 75 80 

ctg gcc gtt tec teg ggg cat gcg gcc cag ctg ctg gtt ttc cat acg 288 
Leu Ala Val Ser Ser Gly His Ala Ala Gin Leu Leu Val Phe His Thr 
85 90 95 

ate atg agg ccg ggt gac aat ttc gtt tec gcc aga cag ctt tac ggc 336 
lie Met Arg Pro Gly Asp Asn Phe Val Ser Ala Arg Gin Leu Tyr Gly 
100 105 110 

ggg teg gcc aat cag ttc ggc cat gcc ttc aag gcc ttc gac tgg cag 384 
Gly Ser Ala Asn Gin Phe Gly His Ala Phe Lys Ala Phe Asp Trp Gin 
115 120 125 
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gtc cgc tgg gcc gat teg gcg gag ccc gaa age ttc gat gcg cag ate 432 
Val Arg Trp Ala Asp Ser Ala Glu Pro Glu Ser Phe Asp Ala Gin lie 
130 135 140 

gac gaa cgc acc aag gcg ate ttc ate gaa age etc gcc aat ccg ggc 480 
Asp Glu Arg Thr Lys Ala lie Phe lie Glu Ser Leu Ala Asn Pro Gly 
145 ~ 150 155 160 

ggc acc ttc gtc gac ata gcc gca ate get gac gtt gcg egg cga cac 52 8 

Gly Thr Phe Val Asp lie Ala Ala lie Ala Asp Val Ala Arg Arg His 
165 170 175 

gga ctg ccg etc ate gtc gac aat acg atg gcg acg ccc tat ctg atg 576 
Gly Leu Pro Leu He Val Asp Asn Thr Met Ala Thr Pro Tyr Leu Met 
180 185 190 



egg ccg etc gaa cac ggc gcc gat ate gtc gtc cat teg etc acc aag 
Arg Pro Leu Glu His Gly Ala Asp He Val Val His Ser Leu Thr Lys 
195 200 205 



ggt acg ttc gac tgg teg aaa tec ggc aag tat ccg ctg ctg teg gag 
Gly Thr Phe Asp Trp Ser Lys Ser Gly Lys Tyr Pro Leu Leu Ser Glu 
225 230 235 240 



ccg gcc att teg ccc ttc aac gcc ttc ctg ate cag acc ggc gtc gag 
Pro Ala He Ser Pro Phe Asn Ala Phe Leu He Gin Thr Gly Val Glu 



275 280 285 



• 



ggg etc gaa gac gat ccg aac cac gca ctg cag aaa cgc tac teg ccg 
Gly Leu Glu Asp Asp Pro Asn His Ala Leu Gin Lys Arg Tyr Ser Pro 
325 330 335 



624 



k tc ate ggc ggt cac ggc aat teg atg ggc ggc ate ate gtc gac ggc 672 
e He Gly Gly His Gly Asn Ser Met Gly Gly He He Val Asp Gly 
210 215 220 



720 



ccg agg ccc gaa tat ggc ggc gtc gtc ctg cac cag gcc ttc ggc aac 7 68 

Pro Arg Pro Glu Tyr Gly Gly Val Val Leu His Gin Ala Phe Gly Asn 

245 250 255 

ttc gcc ttc gcc ate gcc gca egg gta ttg ggt ctg agg gac ttc ggt 816 

Phe Ala Phe Ala He Ala Ala Arg Val Leu Gly Leu Arg Asp Phe Gly 
260 . 265 270 



864 



;g ctg ccg ctg agg atg cag cgc cat tgc gac aac gcg ctg gag gtc 912 
Leu Pro Leu Arg Met Gin Arg His Cys Asp Asn Ala Leu Glu Val 
290 295 300 



gcc aaa tgg ctg aag gga cat gaa aag gtc tec tgg gtc cgc tat tec 960 
Ala Lys Trp Leu Lys Gly His Glu Lys Val Ser Trp Val Arg Tyr Ser 
305 310 315 320 



1008 



aag ggg gcg gga gcc gtt ttc acc ttc ggg etc gcg ggc gga tac gag 1056 

Lys Gly Ala Gly Ala Val Phe Thr Phe Gly Leu Ala Gly Gly Tyr Glu 
340 345 350 

gcg gga aag cgc ttt gtc gag gca ctg gaa atg ttc tec cat ctt gcc 1104 
Ala Gly Lys Arg Phe Val Glu Ala Leu Glu Met Phe Ser His Leu Ala 
355 ' 360 365 

aat ate ggc gac acg cgt teg etc gtc ate cac ccc gca teg acc acg 1152 

Asn He Gly Asp Thr Arg Ser Leu Val He His Pro Ala Ser Thr Thr 
370 375 380 
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cac egg cag etc acg ccg gag cag cag gtc gec gca ggc gec gga ccc 1200 
His Arg Gin Leu Thr Pro Glu Gin Gin Val Ala Ala Gly Ala Gly Pro 
385 390 395 400 

gac gtc ate egg ttg teg gtc ggc ate gag gat gtg gee gac ate att 1248 
Asp Val lie Arg Leu Ser Val Gly He Glu Asp Val Ala Asp He He 
405 410 415 

gec gat etc gaa cag gcg ctg ggc aag gee tga 1281 
Ala Asp Leu Glu Gin Ala Leu Gly Lys Ala 

425 






420 


<210> 


28 


<211> 


426 


<212> 


PRT 


k213> 


Sinorhizobium meliloti 



<400> 28 

Met Lys Ala Gly Pro Gly Phe Ser Thr Leu Ala He His Ala Gly Ala 
1 5 10 15 



Gin Pro Asp Pro Thr Thr Gly Ala Arg Ala Thr Pro He Tyr Gin Thr 
20 25 30 



Thr Ser Phe Val Phe Asn Asp Thr Asp His Ala Ala Ala Leu Phe Gly 
35 40 45 



Leu Gin Gin Phe Gly Asn He Tyr Thr Arg He Met Asn Pro Thr Gin 
50 55 60 



a Val Leu Glu Glu Arg He Ala Ala Leu Glu Gly Gly Thr Ala Gly 
65 70 75 80 



Leu Ala Val Ser Ser Gly His Ala Ala Gin Leu Leu Val Phe His Thr 
85 90 95 



He Met Arg Pro Gly Asp Asn Phe Val Ser Ala Arg Gin Leu Tyr Gly 
100 105 110 



Gly Ser Ala Asn Gin Phe Gly His Ala Phe Lys Ala Phe Asp Trp Gin 
115 120 125 



Val Arg Trp Ala Asp Ser Ala Glu Pro Glu Ser Phe Asp Ala Gin He 
130 135 140 




Asp Glu Arg Thr Lys Ala He Phe He Glu Ser Leu Ala Asn Pro Gly 
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145 



150 



155 



160 



Gly Thr Phe Val Asp He Ala Ala He Ala Asp Val Ala Arg Arg His 
165 170 175 



Gly Leu Pro Leu He Val Asp Asn Thr Met Ala Thr Pro Tyr Leu Met 
180 185 190 

Arg Pro Leu Glu His Gly Ala Asp He Val Val His Ser Leu Thr Lys 
195 200 205 

Phe He Gly Gly His Gly Asn Ser Met Gly Gly He He Val Asp Gly 
210 " 215 220 



m 



lv Thr Phe Asp Trp Ser Lys Ser Gly Lys Tyr Pro Leu Leu Ser Glu 
5 230 235 240 



Pro Arg Pro Glu Tyr Gly Gly Val Val Leu His Gin Ala Phe Gly Asn 
^ 245 250 255 



Phe Ala Phe Ala He Ala Ala Arg Val Leu Gly Leu Arg Asp Phe Gly 
260 265 270 

Pro Ala He Ser Pro Phe Asn Ala Phe Leu He Gin Thr Gly Val Glu 
275 280 285 

Thr Leu Pro Leu Arg Met Gin Arg His Cys Asp Asn Ala Leu Glu Val 
290 295 300 



la Lys Trp Leu Lys Gly His Glu Lys Val Ser Trp Val Arg Tyr Ser 
k 5 310 315 320 



Gly Leu Glu Asp Asp Pro Asn His Ala Leu Gin Lys Arg Tyr Ser Pro 
325 330 335 



Lys Gly Ala Gly Ala Val Phe Thr Phe Gly Leu Ala Gly Gly Tyr Glu 
34 0 34 5 350 

Ala Gly Lys Arg Phe Val Glu Ala Leu Glu Met Phe Ser His Leu Ala 
355 ~ 360 365 

Asn He Gly Asp Thr Arg Ser Leu Val He His Pro Ala Ser Thr Thr 
370 " * 375 380 



His Arg Gin Leu Thr Pro Glu Gin Gin Val Ala Ala Gly Ala Gly Pro 
385 390 395 400 
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Asp Val He Arg Leu Ser Val Gly He Glu Asp Val Ala Asp He He 
405 410 415 



Ala Asp Leu Glu Gin Ala Leu Gly Lys Ala 
420 425 



<210> 29 

<211> 1293 

<212> DNA 

<213> Thermotoga maritima 



# 



<220> 

21> CDS 
<222> (1)..(1293) 



<223> 



<400> 29 

atg gac tgg aag aaa tac ggt tac aac aca agg get ctt cac gca ggt 4 8 

Met Asp Trp Lys Lys Tyr Gly Tyr Asn Thr Arg Ala Leu His Ala Gly 
1 5 10 15 

tat gaa cca ccc gag cag gec aca gga teg aga gcg gtc cct ata tat 9 6 

Tyr Glu Pro Pro Glu Gin Ala Thr Gly Ser Arg Ala Val Pro He Tyr 
20 25 30 

caa acg act tct tac gtt ttc aga gac tct gat cac gcg gcg aga etc 14 4 

Gin Thr Thr Ser Tyr Val Phe Arg Asp Ser Asp His Ala Ala Arg Leu 



35 40 45 



c gca ctg gaa gaa cct ggg ttc ate tat aca agg att gga aat cct 192 

he Ala Leu Glu Glu Pro Gly Phe He Tyr Thr Arg He Gly Asn Pro 
50 55 60 

ace gtc tea gtt ctt gaa gaa aga ata gec gee ctg gaa gaa ggg gtg 24 0 

Thr Val Ser Val Leu Glu Glu Arg He Ala Ala Leu Glu Glu Gly Val 

65 70 75 80 



gga gec tta gcg gtt gee agt gga caa gee get ata act tac gee att 
Gly Ala Leu Ala Val Ala Ser Gly Gin Ala Ala He Thr Tyr Ala He 
85 90 95 



288 



ttg aac ate gcg ggc cca gga gat gag ate gtc age ggg age gcg ctg 336 
Leu Asn He Ala Gly Pro Gly Asp Glu lie Val Ser Gly Ser Ala Leu 
100 105 110 

tat ggg gga acg tac aat ctg ttc aga cac act etc tat aaa aaa tec 384 
Tyr Gly Gly Thr Tyr Asn Leu Phe Arg His Thr Leu Tyr Lys Lys Ser 
115 ~ 120 125 

ggc ate ate gtg aag ttt gtg gat gag aca gat cca aag aac ata gaa 4 32 

Gly He He Val Lys Phe Val Asp Glu Thr Asp Pro Lys Asn He Glu 
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130 135 140 

gag gcc ate acc gag aaa aca aag gcg gtg tac ctt gaa act ate ggg 480 
Glu Ala lie Thr Glu Lys Thr Lys Ala Val Tyr Leu Glu Thr lie Gly 
145 150 155 160 

aat ccc ggt etc aca gtg ccg gac ttt gaa gcg ata gcg gag ate get 52 8 

Asn Pro Gly Leu Thr Val Pro Asp Phe Glu Ala lie Ala Glu lie Ala 
165 170 175 

cac aga cac ggt gtt cct ttg ata gtg gac aat acg gta get ccg tac 576 
His Arg His Gly Val Pro Leu lie Val Asp Asn Thr Val Ala Pro Tyr 
180 185 190 

ata ttc agg ccc ttc gaa cac ggt gcc gac ate gtt gtt tat teg gcc 624 
lie Phe Arg Pro Phe Glu His Gly Ala Asp lie Val Val Tyr Ser Ala 
195 200 205 

acg aaa ttc ate gga gga cac gga aca teg ata ggc ggt etc ate gta 672 
Thr Lys Phe lie Gly Gly His Gly Thr Ser lie Gly Gly Leu lie Val 
210 215 220 

ac age gga aaa ttc gac tgg acg aac gga aag ttt cca gaa etc gtg 720 
Asp Ser Gly Lys Phe Asp Trp Thr Asn Gly Lys Phe Pro Glu Leu Val 
225 230 235 240 

gaa cca gat ccc age tac cac ggt gtg agt tat gtg gag acg ttc aaa 768 
Glu Pro Asp Pro Ser Tyr His Gly Val Ser Tyr Val Glu Thr Phe Lys 
245 250 255 

gaa gca gcc tac ata gca aaa tgt aga acc cag ctt ttg agg gac ctg 816 
Glu Ala Ala Tyr lie Ala Lys Cys Arg Thr Gin Leu Leu Arg Asp Leu 
260 265 270 

gga age tgt atg age ccg ttc aac gcg ttt ctg ttc ate etc gga ctt 864 
Gly Ser Cys Met Ser Pro Phe Asn Ala Phe Leu Phe He Leu Gly Leu 
275 280 285 

gaa acc etc age ttg agg atg aag aaa cac tgt gaa aac gca ctg aag 912 
Glu Thr Leu Ser Leu Arg Met Lys Lys His Cys Glu Asn Ala Leu Lys 
290 295 300 

c gtt gaa ttt ctg aaa teg cat ccc gcc gtg age tgg gtc aac tat 960 
He Val Glu Phe Leu Lys Ser His Pro Ala Val Ser Trp Val Asn Tyr 
305 310 315 320 

ccg ata get gaa ggc aat aaa acc aga gaa aat gcg ctg aaa tac etc 1008 
Pro He Ala Glu Gly Asn Lys Thr Arg Glu Asn Ala Leu Lys Tyr Leu 
325 330 335 

aaa gaa gga tac ggt gcg att gta acg ttc ggt gtg aaa ggc gga aaa 1056 
Lys Glu Gly Tyr Gly Ala He Val Thr Phe Gly Val Lys Gly Gly Lys 
340 345 350 

gag gcg gga aag aag ttc ata gac agt etc aca etc att tec cac etc 1104 
Glu Ala Gly Lys Lys Phe He Asp Ser Leu Thr Leu He Ser His Leu 
355 360 365 

gcc aac att ggt gat gca aga act ctg get att cat ccc get teg aca 1152 
Ala Asn He Gly Asp Ala Arg Thr Leu Ala He His Pro Ala Ser Thr 
370 375 380 

acc cat cag cag etc acg gaa gaa gag cag ttg aaa acg ggt gtt act 1200 
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Thr His Gin Gin Leu Thr Glu Glu Glu Gin Leu Lys Thr Gly Val Thr 
385 390 395 400 

ccg gat atg ata aga ttg tct gtt gga ata gaa gat gtg gaa gat ate 1248 
Pro Asp Met lie Arg Leu Ser Val Gly lie Glu Asp Val Glu Asp lie 
405 410 415 

ata gec gat ctg gat cag get etc aga aaa tct cag gag gga tga 12 93 

lie Ala Asp Leu Asp Gin Ala Leu Arg Lys Ser Gin Glu Gly 
420 425 430 



<210> 30 

<211> 430 

<212> PRT 

<213> Thermotoga maritima 




400> 30 



Met Asp Trp Lys Lys Tyr Gly Tyr Asn Thr Arg Ala Leu His Ala Gly 
15 10 15 



Tyr Glu Pro Pro Glu Gin Ala Thr Gly Ser Arg Ala Val Pro lie Tyr 
20 25 30 



Gin Thr Thr Ser Tyr Val Phe Arg Asp Ser Asp His Ala Ala Arg Leu 
35 40 45 



Phe Ala Leu Glu Glu Pro Gly Phe lie Tyr Thr Arg lie Gly Asn Pro 
50 55 60 



f Val Ser Val Leu Glu Glu Arg lie Ala Ala Leu Glu Glu Gly Val 

70 75 80 



Gly Ala Leu Ala Val Ala Ser Gly Gin Ala Ala lie Thr Tyr Ala lie 
85 90 95 



Leu Asn lie Ala Gly Pro Gly Asp Glu lie Val Ser Gly Ser Ala Leu 
100 105 110 



Tyr Gly Gly Thr Tyr Asn Leu Phe Arg His Thr Leu Tyr Lys Lys Ser 
115 120 125 



Gly lie lie Val Lys Phe Val Asp Glu Thr Asp Pro Lys Asn lie Glu 
130 ~ 135 140 



Glu Ala lie Thr Glu Lys Thr Lys Ala Val Tyr Leu Glu Thr lie Gly 
145 150 155 160 
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Asn Pro Gly Leu Thr Val Pro Asp Phe Glu Ala lie Ala Glu lie Ala 
165 170 175 

His Arg His Gly Val Pro Leu lie Val Asp Asn Thr Val Ala Pro Tyr 
180 185 190 

He Phe Arg Pro Phe Glu His Gly Ala Asp He Val Val Tyr Ser Ala 
195 200 205 

Thr Lys Phe He Gly Gly His Gly Thr Ser He Gly Gly Leu He Val 
210 215 220 

Asp Ser Gly Lys Phe Asp Trp Thr Asn Gly Lys Phe Pro Glu Leu Val 
225 230 235 240 

llu Pro Asp Pro Ser Tyr His Gly Val Ser Tyr Val Glu Thr Phe Lys 
245 250 255 

Glu Ala Ala Tyr He Ala Lys Cys Arg Thr Gin Leu Leu Arg Asp Leu 
260 265 270 

Glv Ser Cys Met Ser Pro Phe Asn Ala Phe Leu Phe He Leu Gly Leu 
275 280 285 

Glu Thr Leu Ser Leu Arg Met Lys Lys His Cys Glu Asn Ala Leu Lys 
290 295 300 

He Val Glu Phe Leu Lys Ser His Pro Ala Val Ser Trp Val Asn Tyr 
305 310 315 320 

ro He Ala Glu Gly Asn Lys Thr Arg Glu Asn Ala Leu Lys Tyr Leu 
325 330 335 

Lys Glu Gly Tyr Gly Ala He Val Thr Phe Gly Val Lys Gly Gly Lys 
340 345 350 

Glu Ala Gly Lys Lys Phe He Asp Ser Leu Thr Leu He Ser His Leu 
355 360 365 

Ala Asn He Gly Asp Ala Arg Thr Leu Ala He His Pro Ala Ser Thr 
370 ' 375 380 

Thr His Gin Gin Leu Thr Glu Glu Glu Gin Leu Lys Thr Gly Val Thr 
385 390 395 400 

Pro Asp Met He Arg Leu Ser Val Gly He Glu Asp Val Glu Asp He 
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405 410 415 



lie Ala Asp Leu Asp Gin Ala Leu Arg Lys Ser Gin Glu Gly 
420 425 430 



<210> 31 

<211> 1314 

<212> DNA 

<213> Streptococcus mutans 
<220> 

<221> CDS 

22> (1) . . (1314) 
<223> 



<400> 31 

atg gag eta att aat aat aaa agg aga get tec atg act cga gaa ttt 48 

Met Glu Leu He Asn Asn Lys Arg Arg Ala Ser Met Thr Arg Glu Phe 
1 5 10 15 

tct ttt gaa act tta caa tta cat gcg gga caa agt gtt gat cct aca 96 

Ser Phe Glu Thr Leu Gin Leu His Ala Gly Gin Ser Val Asp Pro Thr 
20 25 30 

aca aaa teg cgt gca gta cca ate tat cag acg act tec tat gtg ttt 144 

Thr Lys Ser Arg Ala Val Pro He Tyr Gin Thr Thr Ser Tyr Val Phe 
35 40 45 



t gat gca caa gat get gaa gat tct ttt gca ctt cgt aca ccc ggc 192 
Asp Ala Gin Asp Ala Glu Asp Ser Phe Ala Leu Arg Thr Pro Gly 
50 55 60 



aat att tat acg egg ate act aat ccg act aca gee gtt ttt gaa gaa 240 
Asn He Tyr Thr Arg He Thr Asn Pro Thr Thr Ala Val Phe Glu Glu 
65 70 75 80 

egg atg gee get ctt gaa ggt ggt gtc ggt gca ctg gca aca get tct 288 
Arg Met Ala Ala Leu Glu Gly Gly Val Gly Ala Leu Ala Thr Ala Ser 
85 90 95 

ggt atg gca gca gta act tat att gec ttg get ctt get cat gca ggt 336 
Gly Met Ala Ala Val Thr Tyr He Ala Leu Ala Leu Ala His Ala Gly 
100 105 110 

gat cat att gtg tea gca gcg aca gtt tac ggt ggc act ttt aat ctt 384 
Asp His He Val Ser Ala Ala Thr Val Tyr Gly Gly Thr Phe Asn Leu 
115 120 125 

ctt aag gaa act tta cct cgc tat ggc att act aca agt ttt gtt gat 432 
Leu Lys Glu Thr Leu Pro Arg Tyr Gly He Thr Thr Ser Phe Val Asp 
130 135 140 
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gtt 

Val 
145 


get 
Ala 


aat 
Asn 


ttc 
Phe 


get 
Ala 


gaa 
Glu 
150 


att 
He 


gaa 
Glu 


gcg get 
Ala Ala 


att 
He 
155 


aca gac 
Thr Asp 


aag 
Lys 


act 
Thr 


aag 
Lys 
160 


480 


ttt 
Phe 


att 
He 


ate 
He 


get 
Ala 


gaa 
Glu 
165 


acg 
Thr 


tta 
Leu 


gga 
Gly 


aat 
Asn 


cct 
Pro 
170 


ctt 
Leu 


gga aat 
Gly Asn 


ate 
He 


get 
Ala 
175 


gat 
Asp 


528 


ctt 
Leu 


gaa 
Glu 


aaa 
Lys 


tta 
Leu 
180 


get 
Ala 


gag 
Glu 


att 
He 


gec 
Ala 


cat 
His 
185 


cga 
Arg 


cat 
His 


get 
Ala 


att 
He 


ccc 
Pro 
190 


ttg 
Leu 


gtt 

Val 


576 


att 
lie 


gat 
Asp 


aat 
Asn 
195 


acc 
Thr 


ttt 
Phe 


ggt 
Gly 


act 
Thr 


cct 
Pro 
200 


tat 
Tyr 


ttg 
Leu 


ctt 
Leu 


aat 
Asn 


gtc 
Val 
205 


ttc 
Phe 


tct 
Ser 


tac 
Tyr 


624 


ggt 
Gly 


gtt 
Val 
210 


gat 
Asp 


att 
He 


get 
Ala 


gtt 
Val 


cat 
His 
215 


tct 
Ser 


gee 
Ala 


act 
Thr 


aaa 
Lys 


ttt 
Phe 
220 


ate 
He 


ggt 

Gly 


gga 
Gly 


cat 
His 


672 


^Ly 

225 


aca 
Thr 


tct 
Ser 


att 
He 


ggc 
Gly 


ggt 
Gly 
230 


gtc 
Val 


att 
He 


gtt 
Val 


gat 
Asp 


tct gga aac 
Ser Gly Asn 
235 


ttt 
Phe 


gat 
Asp 


tgg 
Trp 
240 


720 


gaa 
Glu 


aaa 
Lys 


tct 
Ser 


gga 
Gly 


aaa 
Lys 
245 


ttc 
Phe 


cca 
Pro 


caa 
Gin 


ttt 
Phe 


gta 
Val 
250 


gaa 
Glu 


cca 
Pro 


gat 
Asp 


cct 
Pro 


tec 
Ser 
255 


tat 
Tyr 


768 


cat 
His 


gac 
Asp 


att 
He 


agt 
Ser 
260 


tat 
Tyr 


aca 
Thr 


cgt gat 
Arg Asp 


att 
He 
265 


gga 
Gly 


aaa 
Lys 


gca get 
Ala Ala 


ttt 
Phe 
270 


gta 
Val 


act 
Thr 


816 


gcg 
Ala 


gtg 
Val 


cgt 
Arg 
275 


acg 
Thr 


caa 
Gin 


ctg 
Leu 


ctg cgt 
Leu Arg 
280 


gat 
Asp 


aca 
Thr 


ggc gee tgc 
Gly Ala Cys 
285 


ctt 
Leu 


tea 
Ser 


cct 
Pro 


864 


ttc 
Phe 


aat 
Asn 
290 


gee 
Ala 


ttt 
Phe 


ctt 
Leu 


ttg 
Leu 


eta 
Leu 
295 


caa 
Gin 


ggt eta 
Gly Leu 


gaa 
Glu 


acc 
Thr 
300 


tta 
Leu 


tea 
Ser 


ctt 
Leu 


cgt 
Arg 


912 


1 

305 


gag 
Glu 


cgt 
Arg 


cat 
His 


gtg 
Val 


gaa 
Glu 
310 


aat 
Asn 


get 
Ala 


aag 
Lys 


aaa 
Lys 


att 
He 
315 


gcg 
Ala 


tac 
Tyr 


tat 
Tyr 


ctg 
Leu 


gaa 
Glu 
320 


960 


aat 
Asn 


cat 
His 


cct 
Pro 


aaa 
Lys 


gtc 
Val 
325 


aca 
Thr 


aaa 
Lys 


gtt 
Val 


aat 
Asn 


tat 
Tyr 
330 


get 
Ala 


agt 
Ser 


ttg 
Leu 


cca 
Pro 


tea 
Ser 
335 


agt 
Ser 


1008 


cct 
Pro 


tat 
Tyr 


tat 
Tyr 


gac 
Asp 
340 


ttg 
Leu 


get 

Ala 


caa 
Gin 


aaa 
Lys 


tac 
Tyr 
345 


ttg 
Leu 


cca 
Pro 


aaa 
Lys 


gga 

Gly 


get 
Ala 
350 


agt 
Ser 


tct 
Ser 


1056 


ate 
He 


ttt 
Phe 


act 
Thr 
355 


ttt 
Phe 


aat 
Asn 


gtt 
Val 


gca 
Ala 


ggc 
Gly 
360 


agt 
Ser 


gcg 
Ala 


aaa 
Lys 


gee 
Ala 


get 
Ala 
365 


cgc 
Arg 


gag 
Glu 


gtc 
Val 


1104 


att 
He 


gac 
Asp 
370 


agt 
Ser 


ctt 
Leu 


gaa 
Glu 


ate 
He 


ttt 
Phe 
375 


tct 
Ser 


gat 
Asp 


ttg 
Leu 


gcg 
Ala 


aat 
Asn 
380 


gtt 
Val 


get 
Ala 


gat 
Asp 


gee 
Ala 


1152 


aaa 
Lys 


tea 
Ser 


eta 
Leu 


gtt 
Val 


gtt 
Val 


cat 
His 


ccg 
Pro 


gca 
Ala 


aca 
Thr 


acc 
Thr 


act 
Thr 


cat 
His 


ggt 

Gly 


caa 
Gin 


atg 
Met 


act 
Thr 


1200 
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385 390 395 400 

gaa gaa gat eta cga get tgc ggt att gaa cct gag caa ate cgt gtt 1248 
Glu Glu Asp Leu Arg Ala Cys Gly lie Glu Pro Glu Gin lie Arg Val 
405 410 415 

tct att ggt ttg gaa aat get gat gac tta ate gaa gat ttg cgc eta 12 96 

Ser lie Gly Leu Glu Asn Ala Asp Asp Leu lie Glu Asp Leu Arg Leu 
420 425 430 

gca ctt gaa aaa ata taa 1314 
Ala Leu Glu Lys lie 
435 



<210> 32 
<211> 437 



<212> PRT 

13 > Streptococcus mutans 



<400> 32 

Met Glu Leu lie Asn Asn Lys Arg Arg Ala Ser Met Thr Arg Glu Phe 
15 10 15 



Ser Phe Glu Thr Leu Gin Leu His Ala Gly Gin Ser Val Asp Pro Thr 
20 25 30 



Thr Lys Ser Arg Ala Val Pro lie Tyr Gin Thr Thr Ser Tyr Val Phe 
35 40 45 



n Asp Ala Gin Asp Ala Glu Asp Ser Phe Ala Leu Arg Thr Pro Gly 
50 55 60 



Asn lie Tyr Thr Arg lie Thr Asn Pro Thr Thr Ala Val Phe Glu Glu 
65 70 75 80 



Arg Met Ala Ala Leu Glu Gly Gly Val Gly Ala Leu Ala Thr Ala Ser 
85 90 95 



Gly Met Ala Ala Val Thr Tyr lie Ala Leu Ala Leu Ala His Ala Gly 
100 105 110 



Asp His lie Val Ser Ala Ala Thr Val Tyr Gly Gly Thr Phe Asn Leu 
115 120 125 



Leu Lys Glu Thr Leu Pro Arg Tyr Gly lie Thr Thr Ser Phe Val Asp 
130 135 140 
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Val Ala Asn Phe Ala Glu lie Glu Ala Ala He Thr Asp Lys Thr Lys 
145 150 155 160 



Phe He He Ala Glu Thr Leu Gly Asn Pro Leu Gly Asn He Ala Asp 
165 170 175 



Leu Glu Lys Leu Ala Glu He Ala His Arg His Ala He Pro Leu Val 
180 185 190 



He Asp Asn Thr Phe Gly Thr Pro Tyr Leu Leu Asn Val Phe Ser Tyr 
195 200 205 



Gly Val Asp He Ala Val His Ser Ala Thr Lys Phe He Gly Gly His 
210 215 220 



y Thr Ser He Gly Gly Val He Val Asp Ser Gly Asn Phe Asp Trp 
5 230 235 240 



Glu Lys Ser Gly Lys Phe Pro Gin Phe Val Glu Pro Asp Pro Ser Tyr 
245 250 255 



His Asp He Ser Tyr Thr Arg Asp He Gly Lys Ala Ala Phe Val Thr 
260 265 270 



Ala Val Arg Thr Gin Leu Leu Arg Asp Thr Gly Ala Cys Leu Ser Pro 
275 280 285 



Phe Asn Ala Phe Leu Leu Leu Gin Gly Leu Glu Thr Leu Ser Leu Arg 
290 295 300 



1 Glu Arg His Val Glu Asn Ala Lys Lys He Ala Tyr Tyr Leu Glu 
Is 310 315 320 



Asn His Pro Lys Val Thr Lys Val Asn Tyr Ala Ser Leu Pro Ser Ser 
325 330 335 



Pro Tyr Tyr Asp Leu Ala Gin Lys Tyr Leu Pro Lys Gly Ala Ser Ser 
340 345 350 



He Phe Thr Phe Asn Val Ala Gly Ser Ala Lys Ala Ala Arg Glu Val 
355 360 365 



He Asp Ser Leu Glu He Phe Ser Asp Leu Ala Asn Val Ala Asp Ala 
370 375 380 



Lys Ser Leu Val Val His Pro Ala Thr Thr Thr His Gly Gin Met Thr 
385 390 395 400 




M/43128 



MetY 



Glu Glu Asp Leu Arg Ala Cys Gly lie Glu Pro Glu Gin lie Arg Val 
405 410 415 



Ser lie Gly Leu Glu Asn Ala Asp Asp Leu lie Glu Asp Leu Arg Leu 
420 425 430 




Ala Leu Glu Lys lie 
435 



<210> 33 

<211> 1431 

<212> DNA 

<213> Burkholderia cepacia 



<220> 

<221> CDS 

<222> (1) . . (1431) 

<223> 




<400> 33 

ttg aag cgc cgc acg ccg gtg ata gga tgg ccg cca ctt tea cct ttc 48 
Leu Lys Arg Arg Thr Pro Val lie Gly Trp Pro Pro Leu Ser Pro Phe 
15 10 15 

gcg agg ccg tec gtg gec ccg ccg ccc age atg tec gcg aac cgt ttc 96 
Ala Arg Pro Ser Val Ala Pro Pro Pro Ser Met Ser Ala Asn Arg Phe 
20 25 30 

c acg ctt gcg ctg cac gec ggc get get ccc gac ccg ace acc ggc 144 
Asp Thr Leu Ala Leu His Ala Gly Ala Ala Pro Asp Pro Thr Thr Gly 
35 40 45 

gcg cgc gec acg ccg att tac cag act acc teg ttt teg ttc cgc gat 192 
Ala Arg Ala Thr Pro lie Tyr Gin Thr Thr Ser Phe Ser Phe Arg Asp 
50 55 60 

tec gac cac gec gcg gcg etc ttc aat atg gag cgc gec ggt cat gtt 24 0 

Ser Asp His Ala Ala Ala Leu Phe Asn Met Glu Arg Ala Gly His Val 
65 70 75 80 

tat teg cgc att teg aac ccg acc gtg gec gtg ttc gag gaa cgc gtg 288 
Tyr Ser Arg lie Ser Asn Pro Thr Val Ala Val Phe Glu Glu Arg Val 
85 90 95 

gec gcg ctg gaa aac ggc gcg ggc gcg ate ggc acg gca age ggc cag 336 
Ala Ala Leu Glu Asn Gly Ala Gly Ala lie Gly Thr Ala Ser Gly Gin 
100 105 110 

gcg gee ctg cat ctg gec att gec acg ctg atg ggc gcg ggt teg cat 3 84 

M/43128 MetY 




Ala 


Ala 


Leu 
115 


His 


Leu 


Ala 


He 


Ala 
120 


Thr 


Leu 


Met Gly Ala 
125 


Gly 


Ser 


His 




ate 
He 


gtc 
Val 
130 


gcc 
Ala 


tec 
Ser 


age 
Ser 


gcg 
Ala 


ctg 
Leu 
135 


tac ggc ggc 
Tyr Gly Gly 


teg 

Car 


cac 

His 
140 


aat 
Asn 


ctg 
Leu 


ctg 
Leu 


cac 
His 


432 


tac 
Tyr 
145 


acg 
Thr 


ttg 
Leu 


egg 
Arg 


cgc 
Arg 


ttc 
Phe 
150 


ggc 

Gly 


ate 
He 


gag 
Glu 


acg 
Thr 


act 
Thr 
155 


ttc 
Phe 


gtc 

V ct-L 


aaa 
Lys 


ccc 
Pro 


ggc 

Gly 
160 


480 


gac 
Asp 


ctg 
Leu 


gac 
Asp 


gcg 
Ala 


tgg 
Trp 
165 


cgc 
Arg 


gcc 
Ala 


gcg 
Ala 


ctg 
Leu 


cgc 
Arg 
170 


cca 
Pro 


aac 
Asn 


acg 
Thr 


egg 
Arg 


ctg 
Leu 
175 


ctg 
Leu 


528 


ttc 
Phe 


ggc 
Gly 


gag 
Glu 


acg 
Thr 
180 


etc 
Leu 


ggc 

Gly 


aat 
Asn 


ccg ggg etc 
Pro Gly Leu 
185 


gac gtg 
Asp Val 


etc 
Leu 


gat 
Asp 

190 


ate 
He 


gcc 
Ala 


576 




gtc 
Val 


gcg 
Ala 
195 


cag 
Gin 


ate 
He 


gcg 
Ala 


cat 
His 


gag 
Glu 
200 


cac 
His 


cgc 
Arg 


gtg 
Val 


ccg 
Pro 


ctg 
Leu 
205 


ctg 
Leu 


gtc 
Val 


gac 
Asp 


624 


teg 
Ser 


acc 
Thr 
210 


ttc 
Phe 


acc 
Thr 


aca 
Thr 


cct 
Pro 


tac 
Tyr 
215 


ctg 
Leu 


etc 
Leu 


aaa 
Lys 


ccg 
Pro 


ttc 
Phe 
220 


gaa 
Glu 


cat 
His 


ggc 

Gly 


gcg 
Ala 


672 


gac 
Asp 
225 


ttc 
Phe 


gtc 
Val 


tat 
Tyr 


cac 
His 


teg 
Ser 
230 


gcc 
Ala 


acc 
Thr 


aaa 
Lys 


ttc 
Phe 


etc 
Leu 
235 


ggc ggc 
Gly Gly 


cac 
His 


ggc 

Gly 


acg 
Thr 
240 


720 


acg 
Thr 


ate 
He 


ggc 
Gly 


ggc 
Gly 


gtg 
Val 
245 


ctg 
Leu 


gtg 
Val 


gac ggc ggc 
Asp Gly Gly 
250 


acg 
Thr 


ttc 
Phe 


gac 
Asp 


ttc 
Phe 


gac 
Asp 
255 


gcc 
Ala 


768 


teg 
Ser 


ggg 

Gly 


cgc 
Arg 


ttc 
Phe 
260 


ccc 
Pro 


gaa 
Glu 


ttc 
Phe 


acc 
Thr 


gaa 
Glu 
265 


cct 
Pro 


tac gac ggc 
Tyr Asp Gly 


ttt 
Phe 
270 


cac 
His 


ggc 

Gly 


816 


^atcr 

• 


gtg 

Val 


ttc 
Phe 
275 


gcc 
Ala 


gag 
Glu 


gag 
Glu 


age 
Ser 


acc 
Thr 
280 


gtc 
Val 


gcg 
Ala 


ccg 
Pro 


ttt 
Phe 


ctg 
Leu 
285 


ctg 
Leu 


cga 
Arg 


gca 
Ala 


864 


cgc 
Arg 


cgc 
Arg 
290 


gag 
Glu 


ggg 

Gly 


ctg 
Leu 


cgc 
Arg 


gac 
Asp 
295 


ttc 
Phe 


ggc gca 
Gly Ala 


tgc 
Cys 


ctg 
Leu 
300 


cat 
His 


ccg 
Pro 


caa 
Gin 


gcc 
Ala 


912 


gca 
Ala 
305 


tgg 
Trp 


caa 
Gin 


ctg 
Leu 


ctg 
Leu 


caa 
Gin 
310 


ggc 

Gly 


ate 
He 


gag 
Glu 


acg 
Thr 


ctg 
Leu 
315 


ccg 
Pro 


ttg 
Leu 


cga 
Arg 


atg 
Met 


gaa 
Glu 
320 


960 


egg 
Arg 


cac 
His 


gtt 
Val 


gcc 
Ala 


aac 
Asn 
325 


acg 
Thr 


cgc 
Arg 


egg gtg 
Arg Val 


gtc 

Val 
330 


gag 
Glu 


ttc 
Phe 


etc 
Leu 


gcc 
Ala 


ggt 
Gly 

j j j 


cac 
His 


1008 


gcc 
Ala 


gcg 
Ala 


gtc 
Val 


ggg 

Gly 
340 


gcc 
Ala 


gtc 

Val 


gcc 
Ala 


tat 
Tyr 


ccg 
Pro 
345 


gaa 
Glu 


ctg 
Leu 


ccc 
Pro 


acg 
Thr 


cac 
His 
350 


CCC 

Pro 


gac 
Asp 


1056 


cac 
His 


gcg 
Ala 


etc 
Leu 


gcg 
Ala 


aag 
Lys 


egg 
Arg 


ctg 
Leu 


ctg 
Leu 


ccg 
Pro 


cgc 
Arg 


ggc gcc ggt 
Gly Ala Gly 


gcc 
Ala 


gtg 

Val 


ttc 
Phe 


1104 



355 360 365 
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age ttc gat ctg cgc ggc gac cgc gec gec gga cgc age ttt ate gaa 1152 
Ser Phe Asp Leu Arg Gly Asp Arg Ala Ala Gly Arg Ser Phe lie Glu 
370 375 380 

gcg etc teg ctg ttc teg cat etc gcg aac gtg ggc gac gcg cgc teg 12 00 

Ala Leu Ser Leu Phe Ser His Leu Ala Asn Val Gly Asp Ala Arg Ser 
385 390 395 400 

etc gtg ate cat ccc gec teg acc acc cac ttt cgc atg gac gee get 1248 

Leu Val lie His Pro Ala Ser Thr Thr His Phe Arg Met Asp Ala Ala 

405 410 415 

gec ctt gee gcg gec ggt ate gee gaa ggc acg ate cgc etc teg ate 12 96 

Ala Leu Ala Ala Ala Gly lie Ala Glu Gly Thr lie Arg Leu Ser lie 
420 425 430 

ggc etc gaa gat ccc gac gat ctg ate gac gat etc aag cgc gcg eta 1344 

Gly Leu Glu Asp Pro Asp Asp Leu He Asp Asp Leu Lys Arg Ala Leu 
435 440 445 



g gee gca cag aaa gcg ggc agt teg age gca gcg cac ggc ggc gca 13 92 

s Ala Ala Gin Lys Ala Gly Ser Ser Ser Ala Ala His Gly Gly Ala 
450 455 460 



tec ggc agt gec gee caa ccc cgc ccg gag tec gca tga 1431 
Ser Gly Ser Ala Ala Gin Pro Arg Pro Glu Ser Ala 
465 470 475 

<210> 34 

<211> 476 

<212> PRT 

<213> Burkholderia cepacia 



<400> 34 



Lys Arg Arg Thr Pro Val He Gly Trp Pro Pro Leu Ser Pro Phe 
5 10 15 



Ala Arg Pro Ser Val Ala Pro Pro Pro Ser Met Ser Ala Asn Arg Phe 
20 25 30 



Asp Thr Leu Ala Leu His Ala Gly Ala Ala Pro Asp Pro Thr Thr Gly 
35 40 45 



Ala Arg Ala Thr Pro He Tyr Gin Thr Thr Ser Phe Ser Phe Arg Asp 
50 55 60 



Ser Asp His Ala Ala Ala Leu Phe Asn Met Glu Arg Ala Gly His Val 
65 70 75 80 

Tyr Ser Arg He Ser Asn Pro Thr Val Ala Val Phe Glu Glu Arg Val 
85 90 95 
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Ala Ala Leu Glu Asn Gly Ala Gly Ala He Gly Thr Ala Ser Gly Gin 
100 105 110 



Ala Ala Leu His Leu Ala He Ala Thr Leu Met Gly Ala Gly Ser His 
115 120 125 



He Val Ala Ser Ser Ala Leu Tyr Gly Gly Ser His Asn Leu Leu His 
130 135 140 



Tyr Thr Leu Arg Arg Phe Gly He Glu Thr Thr Phe Val Lys Pro Gly 
145 150 155 160 



Asp Leu Asp Ala Trp Arg Ala Ala Leu Arg Pro Asn Thr Arg Leu Leu 
165 170 175 



e Gly Glu Thr Leu Gly Asn Pro Gly Leu Asp Val Leu Asp He Ala 
180 185 190 



Ala Val Ala Gin He Ala His Glu His Arg Val Pro Leu Leu Val Asp 
195 200 205 



Ser Thr Phe Thr Thr Pro Tyr Leu Leu Lys Pro Phe Glu His Gly Ala 
210 215 220 



Asp Phe Val Tyr His Ser Ala Thr Lys Phe Leu Gly Gly His Gly Thr 
225 230 235 240 



Thr He Gly Gly Val Leu Val Asp Gly Gly Thr Phe Asp Phe Asp Ala 
245 250 255 



r Gly Arg Phe Pro Glu Phe Thr Glu Pro Tyr Asp Gly Phe His Gly 
260 265 270 



Met Val Phe Ala Glu Glu Ser Thr Val Ala Pro Phe Leu Leu Arg Ala 
275 280 285 



Arg Arg Glu Gly Leu Arg Asp Phe Gly Ala Cys Leu His Pro Gin Ala 
290 295 300 



Ala Trp Gin Leu Leu Gin Gly He Glu Thr Leu Pro Leu Arg Met Glu 
305 310 315 ~ 320 



Arg His Val Ala Asn Thr Arg Arg Val Val Glu Phe Leu Ala Gly His 
325 330 335 




Ala Ala Val Gly Ala Val Ala Tyr Pro Glu Leu Pro Thr His Pro Asp 
M/43128 
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340 345 350 



His Ala Leu Ala Lys Arg Leu Leu Pro Arg Gly Ala Gly Ala Val Phe 
355 360 365 



Ser Phe Asp Leu Arg Gly Asp Arg Ala Ala Gly Arg Ser Phe He Glu 
370 375 380 



Ala Leu Ser Leu Phe Ser His Leu Ala Asn Val Gly Asp Ala Arg Ser 
385 390 395 400 



Leu Val He His Pro Ala Ser Thr Thr His Phe Arg Met Asp Ala Ala 
405 410 415 



Ala Leu Ala Ala Ala Gly He Ala Glu Gly Thr He Arg Leu Ser He 
420 425 430 



Gly Leu Glu Asp Pro Asp Asp Leu He Asp Asp Leu Lys Arg Ala Leu 
435 440 445 



Lys Ala Ala Gin Lys Ala Gly Ser Ser Ser Ala Ala His Gly Gly Ala 
450 455 460 



Ser Gly Ser Ala Ala Gin Pro Arg Pro Glu Ser Ala 
465 470 475 



<210> 35 
<211> 1722 



<212> DNA 

3> Deinococcus radiodurans 



<220> 

<221> CDS 

<222> (1) . . (1722) 

<223> 



<400> 35 

gtg gcc ttc ccg tgc ggt cag gcg ggg aac aag at a aca agg ccg ggc 4 8 

Val Ala Phe Pro Cys Gly Gin Ala Gly Asn Lys He Thr Arg Pro Gly 
15 10 15 

caa tgt gtc aac ggg ggc agg gca cgc tea gcc ccg tct aag ttt cgc 96 
Gin Cys Val Asn Gly Gly Arg Ala Arg Ser Ala Pro Ser Lys Phe Arg 
20 25 30 
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t ? tta CCC gCC tcc 9°9 cta ctt ttt gag gag etc ccg cag 

Leu Asp Pro Leu Pro Ala Ser Ala Leu Leu Phe 3lu 111 Leu Pro Gin 
35 40 45 

cag gag cca ccc act tea gag cgc ccg aga gac ctg get cga cga egg 
Gin Glu Pro Pro Thr Ser Glu Arg Pro Arg Asp Leu Ala Arg A fg Sg 

55 60 



cgc ggc aac egg acc cca tea cgt cac ggt gee aag gee age ccc cta 
Arg Gly Asn Arg Thr Pro Ser Arg His lly La LyI 111 Sr Pro Leu 
" 70 75 80 

ggc gtg tea acg atg age cgc egg gcg gga cca age ggg aag gee aca 
Gly val Ser Thr Met Ser Arg Arg Ala Gly Pro sir lly Lys Til Jhr 

egg atg acg ata ttc aag tgt ccc ttc teg att cac age aga C aa aaa 
Arg Met Thr He Phe Lys Cys Pro Phe Sel He His sir S| Gin lly 
100 105 110 




tgc cgt gac tgg cgc ccc cga ace tgc ttc ccc cga gga gee gee 
■u Cys Arg Asp Trp Arg Pro Arg Thr Cys Phe Pro Arg gy HI HI 
115 120 125 

acc atg acc gat acc aaa cag ccg cag cct ctg cac ttc gag acc tta 
Thr Met Thr Asp Thr Lys Gin Pro Gin Pro Leu His Phe III Sr III 
130 135 140 

cag gtg cac gee gga caa cgc ccc gac ccc gtg acc gga gcg cag caa 
Gin Val His Ala Gly Gin Arg Pro Asp Pro Val Thr lly HI III 11* 
145 150 155 160 

?S p™ ril ST 0 !? C 'u° aa ° tCC ta ° 9t * ttc 9 aa tca "a gag cac 
Thr Pro lie Tyr Ala Thr Asn Ser Tyr Val Phe Glu Ser Pro Glu His 

i65 170 175 

gec gec gac etc ttc ggg ctg egg caa ttc ggc aac ate tac age cgc 
Ala Ala Asp Leu Phe Gly Leu Arg Gin Phe lly Asn He Tyr sir A?g 
180 185 190 

latg aac ccc acc aac gac gtg ttc gag cag egg gtg gec gec etc 
Met Asn Pro Thr Asn Asp Val Phe Glu GlS A?g ?«? Ill HI Leu 
195 200 205 

gaa ggg ggc gtg ggg gcg ctg teg gtg teg age ggg cac gcg ggg cag 
Glu Gly Gly Val Gly Ala Leu Ser Val Ser sir lly His 111 lly Gil 

215 220 

v*? ^ r tg r CtC ^ 9 Ct9 gCg Cag gcg gac aac ate gtc teg 

Leu Val Thr Leu Leu Thr Leu Ala Gin Ala Gly Asp Asn He ?al Ser 

225 230 235 240 

teg ccc aac ctg tac ggc ggc acc gtc aac cag ttc cgc gtc acq etc 
Ser Pro Asn Leu Tyr Gly Gly Thr Val Asn Gl? Phe Arg ?2 Leu 
245 250 255 

aag egg etc ggc ate gag gtg egg ttt acc age aaa gac gag cgc ccc 
Lys Arg Leu Gly He G lu Val Arg Phe Thr Ser Lys Isp 111 A^g Pro 
260 265 270 

III G?u li C T Ct9 « C 9aC 9ag CgC aCg c * g * cc ^ta tat ctg 

Glu Glu Phe Ala Ala Leu He Asp Glu Arg Thr Arg Ala Val Tyr Leu 

M/43128 



144 



192 



240 



288 



336 



384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 
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275 280 285 

gaa acc ate ggc aac ccg gcg ctg aac att ccc gat ttc gag ggc gtg 
Glu Thr He Gly Asn Pro Ala Leu Asn He Pro Asp Phe Glu Gly Val 
290 295 300 

gcg aaa gtc gcg cac gag cac ggc gtc gcg gtg gtc gtg gac aac acc 
Ala Lys Val Ala His Glu His Gly Val Ala Val Val Val Asp Asn Thr 
305 310 315 320 

ttc ggg gec ggc gga tac tac tgc cag ccg ctg egg cac ggc gec aac 
Phe Gly Ala Gly Gly Tyr Tyr Cys Gin Pro Leu Arg His Gly Ala Asn 
325 330 335 

ate gtg ctg cac teg gcg age aag tgg ate ggc ggg cac ggc aac ggc 
He Val Leu His Ser Ala Ser Lys Trp He Gly Gly His Gly Asn Gly 
340 345 350 

ate ggc ggg gtc ate gtg gac ggc ggg aac ttc gac tgg ggc age ggg 
lie Gly Gly Val He Val Asp Gly Gly Asn Phe Asp Trp Gly Ser Gly 
355 360 365 

:gg tat ccg ctg atg acc gag ccc teg ccg agt tat cac ggg ctg aag 
Arg Tyr Pro Leu Met Thr Glu Pro Ser Pro Ser Tyr His Gly Leu Lys 
370 375 380 



ttc tgg gag acg ttc ggg gaa ggc aac ggg ctg ggg ctg ccg aac ate 
Phe Trp Glu Thr Phe Gly Glu Gly Asn Gly Leu Gly Leu Pro Asn He 
385 390 395 400 



gec ttc ate acc cgc gee cgc acc gag ggg ctg cgc gac ctg gga acg 
Ala Phe He Thr Arg Ala Arg Thr Glu Gly Leu Arg Asp Leu Gly Thr 
405 410 415 

acc ctg gcg ccg cag cag gcg tgg cag ttt ctg caa ggc ctt gaa acc 
Thr Leu Ala Pro Gin Gin Ala Trp Gin Phe Leu Gin Gly Leu Glu Thr 
420 425 430 



ctg age ctg cgc gee gag cgc cac gec gag aac acc ctg gcg ctg gcg 
eu Ser Leu Arg Ala Glu Arg His Ala Glu Asn Thr Leu Ala Leu Ala 
435 440 445 



c tgg etc ate age cac ccg gac gtg aag cag gtc act tac ccc ggc 
His Trp Leu He Ser His Pro Asp Val Lys Gin Val Thr Tyr Pro Gly 
450 455 460 



ctg age aac cac ccc cac tac gac egg gcg cag acc tac ttg ccg cgc 

Leu Ser Asn His Pro His Tyr Asp Arg Ala Gin Thr Tyr Leu Pro Arg 

465 470 475 480 

ggg gcg ggc gcg gtg etc acc ttc gag ctg cgc ggg ggc egg gcg gcg 

Gly Ala Gly Ala Val Leu Thr Phe Glu Leu Arg Gly Gly Arg Ala Ala 

485 490 495 

ggc gaa gcg ttt att cgc teg gtc aag etc gcg cag cac gtc gee aac 

Gly Glu Ala Phe He Arg Ser Val Lys Leu Ala Gin His Val Ala Asn 

500 505 510 

gtg ggc gac acc cgc acg ctg gtc att cat ccg gcg age acc acc cac 

Val Gly Asp Thr Arg Thr Leu Val He His Pro Ala Ser Thr Thr His 

515 520 525 

age cag etc gac gag gtg acg cag acg aac gee ggg gtc acg ccg ggc 

M/43128 



912 

960 
1008 
1056 
1104 
1152 
1200 
1248 
1296 
1344 
1392 
1440 
1488 
1536 
1584 
1632 
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Ser Gin Leu Asp Glu Val Thr Gin Thr Asn Ala Gly Val Thr Pro Gly 
530 535 540 



etc ate egg gtg teg gtg ggc ate gag cac gta gac gac ate cgc gag 
Leu lie Arg Val Ser Val Gly lie Glu His Val Asp Asp lie Arg Glu 
545 550 555 560 



1680 



gac ttc gcg cag gee ctg gcg age get ggg gag egg gcg tga 
Asp Phe Ala Gin Ala Leu Ala Ser Ala Gly Glu Arg Ala 
565 570 



1722 




<210> 36 

<211> 573 

<212> PRT 

<213> Deinococcus radiodurans 



400> 36 



Val Ala Phe Pro Cys Gly Gin Ala Gly Asn Lys lie Thr Arg Pro Gly 
15 10 15 



Gin Cys Val Asn Gly Gly Arg Ala Arg Ser Ala Pro Ser Lys Phe Arg 
20 25 30 



Leu Asp Pro Leu Pro Ala Ser Ala Leu Leu Phe Glu Glu Leu Pro Gin 
35 40 45 



Gin Glu Pro Pro Thr Ser Glu Arg Pro Arg Asp Leu Ala Arg Arg Arg 
50 55 60 



Gly Asn Arg Thr Pro Ser Arg His Gly Ala Lys Ala Ser Pro Leu 
70 75 80 



Gly Val Ser Thr Met Ser Arg Arg Ala Gly Pro Ser Gly Lys Ala Thr 
85 90 95 



Arg Met Thr lie Phe Lys Cys Pro Phe Ser lie His Ser Arg Gin Gly 
100 105 110 



Glu Cys Arg Asp Trp Arg Pro Arg Thr Cys Phe Pro Arg Gly Ala Ala 
115 ' 120 125 



Thr Met Thr Asp Thr Lys Gin Pro Gin Pro Leu His Phe Glu Thr Leu 
130 135 140 



Gin Val His Ala Gly Gin Arg Pro Asp Pro Val Thr Gly Ala Gin Gin 
145 150 155 160 
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Thr Pro lie Tyr Ala Thr Asn Ser Tyr Val Phe Glu Ser Pro Glu His 
165 170 175 



Ala Ala Asp Leu Phe Gly Leu Arg Gin Phe Gly Asn He Tyr Ser Arg 
180 185 190 



He Met Asn Pro Thr Asn Asp Val Phe Glu Gin Arg Val Ala Ala Leu 
195 200 205 



Glu Gly Gly Val Gly Ala Leu Ser Val Ser Ser Gly His Ala Gly Gin 
210 215 220 



Leu Val Thr Leu Leu Thr Leu Ala Gin Ala Gly Asp Asn He Val Ser 
225 230 235 240 



r Pro Asn Leu Tyr Gly Gly Thr Val Asn Gin Phe Arg Val Thr Leu 
245 250 255 



Lys Arg Leu Gly lie Glu Val Arg Phe Thr Ser Lys Asp Glu Arg Pro 
260 265 270 



Glu Glu Phe Ala Ala Leu He Asp Glu Arg Thr Arg Ala Val Tyr Leu 
275 280 285 



Glu Thr He Gly Asn Pro Ala Leu Asn He Pro Asp Phe Glu Gly Val 
290 295 300 

Ala Lys Val Ala His Glu His Gly Val Ala Val Val Val Asp Asn Thr 
305 310 315 320 



e Gly Ala Gly Gly Tyr Tyr Cys Gin Pro Leu Arg His Gly Ala Asn 
325 " 330 335 



He Val Leu His Ser Ala Ser Lys Trp He Gly Gly His Gly Asn Gly 
340 345 350 



He Gly Gly Val He Val Asp Gly Gly Asn Phe Asp Trp Gly Ser Gly 
355 360 365 



Arg Tyr Pro Leu Met Thr Glu Pro Ser Pro Ser Tyr His Gly Leu Lys 
370 375 380 



Phe Trp Glu Thr Phe Gly Glu Gly Asn Gly Leu Gly Leu Pro Asn He 
385 390 395 400 



Ala Phe He Thr Arg Ala Arg Thr Glu Gly Leu Arg Asp Leu Gly Thr 
405 410 415 
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Thr Leu Ala Pro Gin Gin Ala Trp Gin Phe Leu Gin Gly Leu Glu Thr 
420 425 430 



Leu Ser Leu Arg Ala Glu Arg His Ala Glu Asn Thr Leu Ala Leu Ala 
435 440 445 



His Trp Leu He Ser His Pro Asp Val Lys Gin Val Thr Tyr Pro Gly 
450 455 460 



Leu Ser Asn His Pro His Tyr Asp Arg Ala Gin Thr Tyr Leu Pro Arg 
465 470 475 480 




Gly Ala Gly Ala Val Leu Thr Phe Glu Leu Arg Gly Gly Arg Ala Ala 
485 490 495 



ly Glu Ala Phe He Arg Ser Val Lys Leu Ala Gin His Val Ala Asn 
500 505 510 



Val Gly Asp Thr Arg Thr Leu Val He His Pro Ala Ser Thr Thr His 
515 520 525 



Ser Gin Leu Asp Glu Val Thr Gin Thr Asn Ala Gly Val Thr Pro Gly 
530 535 540 



Leu He Arg Val Ser Val Gly He Glu His Val Asp Asp He Arg Glu 
545 550 555 560 




Asp Phe Ala Gin Ala Leu Ala Ser Ala Gly Glu Arg Ala 
5 65 57 0 



Rio> 
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atg acc gac cag gcc ttt gac acg ctg caa att cac gcg ggc gcc gaa 

Met Thr Asp Gin Ala Phe Asp Thr Leu Gin lie His Ala Gly Ala Glu 

1 5 10 15 

ccc gat ccc gcg acg ggc gcg egg cag gtg ccg att tac cag acc acc 

Pro Asp Pro Ala Thr Gly Ala Arg Gin Val Pro lie Tyr Gin Thr Thr 
20 25 30 

tec tat gtc ttc aag gac gcc gac cat gcc gcg cgc ctg ttc ggg ctg 

Ser Tyr Val Phe Lys Asp Ala Asp His Ala Ala Arg Leu Phe Gly Leu 
35 40 45 

cag gag gtg ggc tat ate tat tec cgc ctg acc aac ccg acc gtt teg 

Gin Glu Val Gly Tyr He Tyr Ser Arg Leu Thr Asn Pro Thr Val Ser 
50 55 60 

gca ctg gcc gcc cgc gtt gcg gcg ctt gaa ggc ggc gtg ggc gcg gtc 

Ala Leu Ala Ala Arg Val Ala Ala Leu Glu Gly Gly Val Gly Ala Val 

65 70 75 80 



c tgc teg tec ggc cat gcg gcg cag ate atg gcg ctg ttt ccg ctg 
s Cys Ser Ser Gly His Ala Ala Gin He Met Ala Leu Phe Pro Leu 
85 90 95 



atg ggg ccg ggg ctg aac ate gtc gcc teg acc egg ctt tac ggc ggc 
Met Gly Pro Gly Leu Asn He Val Ala Ser Thr Arg Leu Tyr Gly Gly 
100 105 110 

acg ate acc cag ttc age cag acc ate aaa cgc ttc ggc tgg tec tgc 
Thr He Thr Gin Phe Ser Gin Thr He Lys Arg Phe Gly Trp Ser Cys 
115 120 125 

acc ttt gtc gat ttc gac gat ctg gcg gcg etc gag gcc gcg gtg gat 
Thr Phe Val Asp Phe Asp Asp Leu Ala Ala Leu Glu Ala Ala Val Asp 
130 135 140 

gac aac acc egg gcg ate ttt tgc gaa teg ate teg aac ccg ggc ggc 
Asp Asn Thr Arg Ala He Phe Cys Glu Ser He Ser Asn Pro Gly Gly 
145 150 155 160 



ate acc gac ctg ccc gcc gtc gcg gcg gtg gcg aac aag gtc ggc 
He Thr Asp Leu Pro Ala Val Ala Ala Val Ala Asn Lys Val Gly 
165 170 175 



ctg ccg etc att gtc gac aac acg ctg gcc teg cct tat etc tgc cgc 

Leu Pro Leu He Val Asp Asn Thr Leu Ala Ser Pro Tyr Leu Cys Arg 

180 185 190 

ccg ate gag cat ggc gcg acg ctg gtt gtc cat tec gcc acg aaa tac 

Pro He Glu His Gly Ala Thr Leu Val Val His Ser Ala Thr Lys Tyr 

195 200 205 

ctg acc ggc aac ggc acg gtg acg ggc ggg gtg ate gtc gat teg ggc 

Leu Thr Gly Asn Gly Thr Val Thr Gly Gly Val He Val Asp Ser Gly 

210 215 220 

aag ttc gac tgg teg gcc teg ggc aag ttc ccc age ctt teg gcg ccc 

Lys Phe Asp Trp Ser Ala Ser Gly Lys Phe Pro Ser Leu Ser Ala Pro 

225 230 235 240 

gaa ccc gcc tat cac ggg ctg aag ttc cac gag gca etc ggc ccg atg 
Glu Pro Ala Tyr His Gly Leu Lys Phe His Glu Ala Leu Gly Pro Met 

245 250 255 
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gcc ttc acc ttc cat teg ate gec gtc ggg ctg cgc gat ctg ggc atg 816 
Ala Phe Thr Phe His Ser lie Ala Val Gly Leu Arg Asp Leu Gly Met 
260 265 270 

acg atg aac ccg cag ggc gcg cat tac acg ctg atg ggg ate gag acg 864 
Thr Met Asn Pro Gin Gly Ala His Tyr Thr Leu Met Gly He Glu Thr 
275 280 285 

etc age ctg cgc atg gac aag cac gtc gcc aat gcg aag gcg gtg gcg 912 
Leu Ser Leu Arg Met Asp Lys His Val Ala Asn Ala Lys Ala Val Ala 
290 295 300 

gaa tgg ctg gcc aaa gac ccg cgc ate gac ttc gtc acc tgg gcc ggg 960 
Glu Trp Leu Ala Lys Asp Pro Arg He Asp Phe Val Thr Trp Ala Gly 
305 310 315 320 

ctg ccc tec teg ccc tgg cac gaa cgc gcc gag egg ctt tgc ccg aag 1008 
Leu Pro Ser Ser Pro Trp His Glu Arg Ala Glu Arg Leu Cys Pro Lys 
325 330 335 

'gg gcg ggg gcg ctt ttc acc gtc gcg gtc aag ggc ggc tat gag gcc 1056 
ly Ala Gly Ala Leu Phe Thr Val Ala Val Lys Gly Gly Tyr Glu Ala 
340 345 350 

tgc gtg aaa ttg gtc aac aat etc aag ctg ttc age cat gtg gca aac 1104 
Cys Val Lys Leu Val Asn Asn Leu Lys Leu Phe Ser His Val Ala Asn 
355 360 365 

ctg ggc gac gcg cgc teg ctg ate ate cat teg gcc teg acc acg cac 1152 
Leu Gly Asp Ala Arg Ser Leu He He His Ser Ala Ser Thr Thr His 
370 375 380 

cgt cag ctg acc gag gaa cag cag ate aag gcg ggg gcg gcg ccg aat 1200 
Arg Gin Leu Thr Glu Glu Gin Gin He Lys Ala Gly Ala Ala Pro Asn 
385 390 395 400 

gtg gtg egg etc teg ate ggg ate gag aat gcc gcc gat ctg ate gcc 124 8 

Val Val Arg Leu Ser He Gly He Glu Asn Ala Ala Asp Leu He Ala 
405 410 415 

b ctg gat cag get ctg gcc gcc gcc acc gcc tga 12 84 

p Leu Asp Gin Ala Leu Ala Ala Ala Thr Ala 
420 425 



<210> 38 

<211> 427 

<212> PRT 

<213> Rhodobacter capsulatus 




<400> 38 

Met Thr Asp Gin Ala Phe Asp Thr Leu Gin He His Ala Gly Ala Glu 
15 10 15 



Pro Asp Pro Ala Thr Gly Ala Arg Gin Val Pro He Tyr Gin Thr Thr 
M/43128 
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20 



25 



30 




Ser Tyr Val Phe Lys Asp Ala Asp His Ala Ala Arg Leu Phe Gly Leu 
35 40 45 



Gin Glu Val Gly Tyr lie Tyr Ser Arg Leu Thr Asn Pro Thr Val Ser 
50 55 60 

Ala Leu Ala Ala Arg Val Ala Ala Leu Glu Gly Gly Val Gly Ala Val 
65 70 75 80 



Cys Cys Ser Ser Gly His Ala Ala Gin He Met Ala Leu Phe Pro Leu 
85 90 95 

Met Gly Pro Gly Leu Asn He Val Ala Ser Thr Arg Leu Tyr Gly Gly 
100 105 110 



Thr He Thr Gin Phe Ser Gin Thr He Lys Arg Phe Gly Trp Ser Cys 
115 120 125 

Thr Phe Val Asp Phe Asp Asp Leu Ala Ala Leu Glu Ala Ala Val Asp 
130 135 140 

Asp Asn Thr Arg Ala He Phe Cys Glu Ser He Ser Asn Pro Gly Gly 
145 150 155 160 

Tyr He Thr Asp Leu Pro Ala Val Ala Ala Val Ala Asn Lys Val Gly 
165 170 175 



Leu Pro Leu He Val Asp Asn Thr Leu Ala Ser Pro Tyr Leu Cys Arg 
180 185 190 



Pro He Glu His Gly Ala Thr Leu Val Val His Ser Ala Thr Lys Tyr 
195 200 205 




Leu Thr Gly Asn Gly Thr Val Thr Gly Gly Val He Val Asp Ser Gly 
210 *" 215 220 

Lys Phe Asp Trp Ser Ala Ser Gly Lys Phe Pro Ser Leu Ser Ala Pro 
225 " 230 235 240 

Glu Pro Ala Tyr His Gly Leu Lys Phe His Glu Ala Leu Gly Pro Met 
245 250 255 



Ala Phe Thr Phe His Ser He Ala Val Gly Leu Arg Asp Leu Gly Met 
260 265 270 
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Thr Met Asn Pro Gin Gly Ala His Tyr Thr Leu Met Gly lie Glu Thr 
275 280 285 



Leu Ser Leu Arg Met Asp Lys His Val Ala Asn Ala Lys Ala Val Ala 
290 295 300 



Glu Trp Leu Ala Lys Asp Pro Arg lie Asp Phe Val Thr Trp Ala Gly 
305 310 315 320 



Leu Pro Ser Ser Pro Trp His Glu Arg Ala Glu Arg Leu Cys Pro Lys 
325 330 335 



Gly Ala Gly Ala Leu Phe Thr Val Ala Val Lys Gly Gly Tyr Glu Ala 
340 345 350 



s Val Lys Leu Val Asn Asn Leu Lys Leu Phe Ser His Val Ala Asn 
3 55 360 365 



Leu Gly Asp Ala Arg Ser Leu lie lie His Ser Ala Ser Thr Thr His 
370 375 380 



Arg Gin Leu Thr Glu Glu Gin Gin lie Lys Ala Gly Ala Ala Pro Asn 
385 390 395 400 



Val Val Arg Leu Ser lie Gly lie Glu Asn Ala Ala Asp Leu lie Ala 
405 410 415 



Asp Leu Asp Gin Ala Leu Ala Ala Ala Thr Ala 
420 425 



0> 39 

11> 1269 

<212> DNA 

<213> Pasteurella multocida 
<220> 

<221> CDS 

<222> (1) . . (1269) 

<223> 



<400> 39 

atg gaa ttt gca aca aaa tgt eta cat gec ggt tat aca ccg aaa aat 48 
Met Glu Phe Ala Thr Lys Cys Leu His Ala Gly Tyr Thr Pro Lys Asn 
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1 5 10 15 

99t gag cct cgt gtt caa ccg ate gta caa agt acc act ttt acc tac 
Gly Glu Pro Arg Val Gin Pro lie Val Gin Ser Thr Thr Phe Thr Tyr 
20 25 30 

gat tec gec gaa gaa att ggt aag tta ttt gat tta caa gcg get ggc 
Asp Ser Ala Glu Glu lie Gly Lys Leu Phe Asp Leu Gin Ala Ala Gly 
35 40 45 

tat ttt tac acc cgc ctt tea aat cct act acc aat gcg gca gaa gaa 
Tyr Phe Tyr Thr Arg Leu Ser Asn Pro Thr Thr Asn Ala Ala Glu Glu 
50 55 60 

aaa att acc gca ctt gaa ggc ggt gta gca acc atg tgt acc gca tea 
Lys lie Thr Ala Leu Glu Gly Gly Val Ala Thr Met Cys Thr Ala Ser 
65 70 75 80 

ggg caa gec gee gtg ttt tac gcg atg etc aat att tta caa gec ggt 
ply Gin Ala Ala Val Phe Tyr Ala Met Leu Asn lie Leu Gin Ala Gly 
85 90 95 

fcfat cac ttt att tct tea teg tat gtt tac ggt ggt age tac aac tta 
Asp His Phe lie Ser Ser Ser Tyr Val Tyr Gly Gly Ser Tyr Asn Leu 
100 105 110 



ttt gca cat acc ttc aaa aaa atg gga att gag gtc act ttt gtg gat 
Phe Ala His Thr Phe Lys Lys Met Gly lie Glu Val Thr Phe Val Asp 
115 120 125 

caa gat tta cct ctt gag gaa tta aaa aaa get att cgc cca aat acg 
Gin Asp Leu Pro Leu Glu Glu Leu Lys Lys Ala lie Arg Pro Asn Thr 
130 135 140 

aaa gee att ttt gec gaa act att gee aat ccc gca tta cgc gtg ttg 
Lys Ala He Phe Ala Glu Thr He Ala Asn Pro Ala Leu Arg Val Leu 
145 150 155 160 



gat att gaa aag ttt gtt gca ctt gcg aag gca gca caa gec cct tta 
sp He Glu Lys Phe Val Ala Leu Ala Lys Ala Ala Gin Ala Pro Leu 
165 170 175 



a gtt gac aat act ttt gca acc ccg tat ttt tgt cgc cct ate gaa 

Leu Val Asp Asn Thr Phe Ala Thr Pro Tyr Phe Cys Arg Pro He Glu 
180 185 190 

ttt ggt get aac gtg gta att cat agt acg tea aaa tat tta gat ggg 

Phe Gly Ala Asn Val Val He His Ser Thr Ser Lys Tyr Leu Asp Gly 
195 200 205 

cat gcg att gcg ttg gga ggt teg ate aca gat ggc ggg aat ttt gat 

His Ala He Ala Leu Gly Gly Ser He Thr Asp Gly Gly Asn Phe Asp 
210 215 220 

tgg aat aat ggt aaa ttc cca caa tta age aca cct gat caa act tat 

Trp Asn Asn Gly Lys Phe Pro Gin Leu Ser Thr Pro Asp Gin Thr Tyr 

225 230 235 240 

cac ggt tta gtt tat acc gaa acc ttt gtt cca gee get tat att gtc 

His Gly Leu Val Tyr Thr Glu Thr Phe Val Pro Ala Ala Tyr He Val 
245 250 255 

aaa gee cgt gtg caa tta atg cgt gat tta ggt gee aca cca gca cca 

M/43128 
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240 



288 



336 



3 84 



432 



480 



528 



576 



624 



672 



720 



768 



816 

MetY 




80 

Lys Ala Arg Val Gin Leu Met Arg Asp Leu Gly Ala Thr Pro Ala Pro 
260 265 270 

caa aat agt ttc ttg etc aat gtg ggc atg gaa act ctt gca ctg cgt 864 
Gin Asn Ser Phe Leu Leu Asn Val Gly Met Glu Thr Leu Ala Leu Arg 
275 280 285 

atg caa cgt cat tat gaa aat gca caa gcg gtc gec gaa ttt tta gaa 912 
Met Gin Arg His Tyr Glu Asn Ala Gin Ala Val Ala Glu Phe Leu Glu 
290 295 300 

aat cat cca caa gtg gca aaa gtg agt tat ccg ggc ttg gca agt tea 960 
Asn His Pro Gin Val Ala Lys Val Ser Tyr Pro Gly Leu Ala Ser Ser 
305 310 315 320 

cct gat cat gca eta aaa caa aaa tat tta cca aac ggt tta tgt ggt 1008 
Pro Asp His Ala Leu Lys Gin Lys Tyr Leu Pro Asn Gly Leu Cys Gly 
325 330 335 

gtg att tec ttt gaa att aga ggg gga aga gaa act gca gca aaa tgg 1056 
" al lie Ser Phe Glu He Arg Gly Gly Arg Glu Thr Ala Ala Lys Trp 
340 345 350 

ctg aat gcg eta caa ctg get tct cgt gaa gtc cat gta gcg gat att 1104 
Leu Asn Ala Leu Gin Leu Ala Ser Arg Glu Val His Val Ala Asp He 
355 360 365 

cgc act tgt get tta cat ccg gcg acg tea aca cac cgt caa tta agt 1152 
Arg Thr Cys Ala Leu His Pro Ala Thr Ser Thr His Arg Gin Leu Ser 
370 375 380 

gag get gaa tta gaa aaa 'gtg ggg att tct gcg ggt tta att cgt ctt 1200 
Glu Ala Glu Leu Glu Lys Val Gly He Ser Ala Gly Leu He Arg Leu 
385 390 395 400 

tct tgc ggt att gaa agt ate caa gat att ttg get gac tta gaa caa 124 8 

Ser Cys Gly He Glu Ser He Gin Asp He Leu Ala Asp Leu Glu Gin 
405 410 415 



ca ttc cac gcg gca aaa taa 
Phe His Ala Ala Lys 
420 



<210> 40 

<211> 422 

<212> PRT 

<213> Pasteurella multocida 

<400> 40 

Met Glu Phe Ala Thr Lys Cys Leu His Ala Gly Tyr Thr Pro Lys Asn 
1 5 10 15 



Gly Glu Pro Arg Val Gin Pro He Val Gin Ser Thr Thr Phe Thr Tyr 
20 25 30 



1269 
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Asp Ser Ala Glu Glu lie Gly Lys Leu Phe Asp Leu Gin Ala Ala Gly 
35 40 45 



Tyr Phe Tyr Thr Arg Leu Ser Asn Pro Thr Thr Asn Ala Ala Glu Glu 
50 55 60 



Lys lie Thr Ala Leu Glu Gly Gly Val Ala Thr Met Cys Thr Ala Ser 
65 70 75 80 



Gly Gin Ala Ala Val Phe Tyr Ala Met Leu Asn lie Leu Gin Ala Gly 
85 90 95 



Asp His Phe lie Ser Ser Ser Tyr Val Tyr Gly Gly Ser Tyr Asn Leu 
100 105 110 



e Ala His Thr Phe Lys Lys Met Gly lie Glu Val Thr Phe Val Asp 
115 120 125 



Gin Asp Leu Pro Leu Glu Glu Leu Lys Lys Ala lie Arg Pro Asn Thr 
130 135 140 



Lys Ala He Phe Ala Glu Thr He Ala Asn Pro Ala Leu Arg Val Leu 
145 150 155 160 



Asp He Glu Lys Phe Val Ala Leu Ala Lys Ala Ala Gin Ala Pro Leu 
165 170 175 



Leu Val Asp Asn Thr Phe Ala Thr Pro Tyr Phe Cys Arg Pro He Glu 
180 185 190 



Gly Ala Asn Val Val He His Ser Thr Ser Lys Tyr Leu Asp Gly 
195 200 205 



His Ala He Ala Leu Gly Gly Ser He Thr Asp Gly Gly Asn Phe Asp 
210 215 220 



Trp Asn Asn Gly Lys Phe Pro Gin Leu Ser Thr Pro Asp Gin Thr Tyr 
225 230 235 240 



His Gly Leu Val Tyr Thr Glu Thr Phe Val Pro Ala Ala Tyr He Val 
245 250 255 



Lys Ala Arg Val Gin Leu Met Arg Asp Leu Gly Ala Thr Pro Ala Pro 
260 265 270 



Gin Asn Ser Phe Leu Leu Asn Val Gly Met Glu Thr Leu Ala Leu Arg 
275 280 285 
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Met Gin Arg His Tyr Glu Asn Ala Gin Ala Val Ala Glu Phe Leu Glu 
290 295 300 



Asn His Pro Gin Val Ala Lys Val Ser Tyr Pro Gly Leu Ala Ser Ser 

305 310 315 320 

Pro Asp His Ala Leu Lys Gin Lys Tyr Leu Pro Asn Gly Leu Cys Gly 

325 330 335 



Val lie Ser Phe Glu He Arg Gly Gly Arg Glu Thr Ala Ala Lys Trp 
340 345 350 



Leu Asn Ala Leu Gin Leu Ala Ser Arg Glu Val His Val Ala Asp He 
355 360 365 



g Thr Cys Ala Leu His Pro Ala Thr Ser Thr His Arg Gin Leu Ser 
370 375 380 

Glu Ala Glu Leu Glu Lys Val Gly He Ser Ala Gly Leu He Arg Leu 
385 390 395 400 



Ser Cys Gly He Glu Ser tie Gin Asp He Leu Ala Asp Leu Glu Gin 
405 410 415 



Ala Phe His Ala Ala Lys 
420 



<210> 41 

11> 1266 

12 > DNA 

<213> Clostridium difficile 

<220> 

<221> CDS 

<222> (1) . . (1266) 

<223> 



<400> 41 

atg tat aat aaa gaa aca ata tgt gtg caa gga aat tat aaa cca ggt 
Met Tyr Asn Lys Glu Thr He Cys Val Gin Gly Asn Tyr Lys Pro Gly 
1 5 10 15 




48 
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aat gga gaa cca aga gta eta cct tta tat caa agt aca act ttt aaa 
Asn Gly Glu Pro Arg Val Leu Pro Leu Tyr Gin Ser Thr Thr Phe Lys 
20 25 30 



gga cat ata tat tea aga ata age aat cct act att caa get ttt gaa 
Gly His lie Tyr Ser Arg lie Ser Asn Pro Thr lie Gin Ala Phe Glu 
50 55 60 

gaa aaa ata agt tta eta gag ggt gga gta tct tct gta get gta tea 
Glu Lys He Ser Leu Leu Glu Gly Gly Val Ser Ser Val Ala Val Ser 
65 70 75 80 

tea ggg caa tct gca aat atg ttg gca gtt tta aat ata tgt aaa tea 
Ser Gly Gin Ser Ala Asn Met Leu Ala Val Leu Asn He Cys Lys Ser 
85 90 95 



a gat agt ata ctt tgt tct tea aaa gta tat gga gga aca ttc aat 
y Asp Ser He Leu Cys Ser Ser Lys Val Tyr Gly Gly Thr Phe Asn 
100 105 110 



• 



aag tat gga gca aat ata gtt act cat tct ace aca aaa tat tta gat 
Lys Tyr Gly Ala Asn He Val Thr His Ser Thr Thr Lys Tyr Leu Asp 
195 200 205 



act aaa gca aga gtt cag ttg ctt aga gac tat gga aat tgt tta age 
Thr Lys Ala Arg Val Gin Leu Leu Arg Asp Tyr Gly Asn Cys Leu Ser 
260 265 270 



96 



tat age agt ata gac caa ctt get gaa tta ttt gat tta aaa gtt gat 144 
Tyr Ser Ser He Asp Gin Leu Ala Glu Leu Phe Asp Leu Lys Val Asp 
35 40 45 



192 



240 



288 



336 



tta eta gga cct agt ctt aaa aaa ttt ggt ata gat tta ata teg ttt 384 
Leu Leu Gly Pro Ser Leu Lys Lys Phe Gly He Asp Leu He Ser Phe 
115 120 125 

gac tta gat tea agt gaa gat gag ata gta gaa ctt gca aag gaa aat 432 
Asp Leu Asp Ser Ser Glu Asp Glu He Val Glu Leu Ala Lys Glu Asn 
130 135 140 

act aag gtt gtg ttt gca gaa aca ctt gca aat cca act ctt gaa gtc 480 
Thr Lys Val Val Phe Ala Glu Thr Leu Ala Asn Pro Thr Leu Glu Val 
145 150 155 160 

ata gat ttt gaa aaa ata gca aat gta get aag aga att aat gtt cca 52 8 

He Asp Phe Glu Lys He Ala Asn Val Ala Lys Arg He Asn Val Pro 
165 170 175 



k t att gtt gat aat tea tta gca tct cca gtg ctt tgt aac cct tta 576 
He Val Asp Asn Ser Leu Ala Ser Pro Val Leu Cys Asn Pro Leu 
180 185 190 



624 



ggg cat get tea agt gtt gga gga att ata gtg gat ggt gga aac ttt 672 

Gly His Ala Ser Ser Val Gly Gly He He Val Asp Gly Gly Asn Phe 
210 215 220 

aac tgg gat aat gga aaa ttt cca gaa tta gtt gag cca gac cca aca 

Asn Trp Asp Asn Gly Lys Phe Pro Glu Leu Val Glu Pro Asp Pro Thr 
225 * 230 235 240 



720 



tat cat ggt ata age tat act caa aaa ttt gga aat gec gca tat gca 768 
Tyr His Gly He Ser Tyr Thr Gin Lys Phe Gly Asn Ala Ala Tyr Ala 
245 250 255 



816 
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84 



cca ttc aat gcg tat ctt act aat tta aat gtt gaa aca eta cat ctt 864 
Pro Phe Asn Ala Tyr Leu Thr Asn Leu Asn Val Glu Thr Leu His Leu 
275 280 285 

aga atg gag aga cat agt gaa aat gca ctt aaa ata get aga ttt tta 912 
Arg Met Glu Arg His Ser Glu Asn Ala Leu Lys lie Ala Arg Phe Leu 
290 295 300 

gaa aaa cat gaa aat gta gat tgg att aat tac cca gga ctt gaa gat 960 
Glu Lys His Glu Asn Val Asp Trp lie Asn Tyr Pro Gly Leu Glu Asp 
305 A 310 315 320 



aac aag tat tat gag aat gec aaa aag tat tta tea aga gga tgt agt 
Asn Lys Tyr Tyr Glu Asn Ala Lys Lys Tyr Leu Ser Arg Gly Cys Ser 
325 330 335 



aca gaa gaa caa tta att gca tct gga gta ttg cct tea eta ata aga 
Thr Glu Glu Gin Leu He Ala Ser Gly Val Leu Pro Ser Leu He Arg 
385 390 395 400 

tta tct gtt gga ata gaa aat gta gag gat tta ata get gat tta aat 
Leu Ser Val Gly He Glu Asn Val Glu Asp Leu He Ala Asp Leu Asn 
405 410 415 

caa get tta aat ttc taa 
Gin Ala Leu Asn Phe 





420 




42 


<211> 


421 


<212> 


PRT 


<213> 


Clostridium difficile 


<4O0> 


42 



Met Tyr Asn Lys Glu Thr He Cys Val Gin Gly Asn Tyr Lys Pro Gly 
1 5 10 15 

Asn Gly Glu Pro Arg Val Leu Pro Leu Tyr Gin Ser Thr Thr Phe Lys 
20 25 30 



1008 



ggt gtt tta tea ttt gga gta aga ggt ggg tta gaa aat gee aaa aaa 1056 
Gly Val Leu Ser Phe Gly Val Arg Gly Gly Leu Glu Asn Ala Lys Lys 
340 345 350 



1104 



t gtg gaa aaa tta cag ata gca tct ttg gtt aca cat gtt tea gat 

he Val Glu Lys Leu Gin He Ala Ser Leu Val Thr His Val Ser Asp 
355 360 365 

gta aga act tgt gtt ata cat cca get tea act act cat aga caa tta 1152 

Val Arg Thr Cys Val He His Pro Ala Ser Thr Thr His Arg Gin Leu 
370 375 380 



1200 



1248 



1266 



Tyr Ser Ser He Asp Gin Leu Ala Glu Leu Phe Asp Leu Lys Val Asp 
M/43128 
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85 

35 40 45 

Gly His lie Tyr Ser Arg lie Ser Asn Pro Thr He Gin Ala Phe Glu 
50 55 ' 60 

Glu Lys He Ser Leu Leu Glu Gly Gly Val Ser Ser Val Ala Val Ser 
65 70 75 80 

Ser Gly Gin Ser Ala Asn Met Leu Ala Val Leu Asn He Cys Lys Ser 
85 90 95 

Gly Asp Ser He Leu Cys Ser Ser Lys Val Tyr Gly Gly Thr Phe Asn 
100 105 110 



Leu Leu Gly Pro Ser Leu Lys Lys Phe Gly He Asp Leu He Ser Phe 
115 120 125 



Asp Leu Asp Ser Ser Glu Asp Glu He Val Glu Leu Ala Lys Glu Asn 
130 135 140 

Thr Lys Val Val Phe Ala Glu Thr Leu Ala Asn Pro Thr Leu Glu Val 
145 150 155 160 

He Asp Phe Glu Lys He Ala Asn Val Ala Lys Arg He Asn Val Pro 
165 170 175 

Phe He Val Asp Asn Ser Leu Ala Ser Pro Val Leu Cys Asn Pro Leu 
180 185 190 



Lys Tyr Gly Ala Asn He Val Thr His Ser Thr Thr Lys Tyr Leu Asp 
195 ' 200 205 



Gly His Ala Ser Ser Val Gly Gly He He Val Asp Gly Gly Asn Phe 
210 215 220 

Asn Trp Asp Asn Gly Lys Phe Pro Glu Leu Val Glu Pro Asp Pro Thr 
225 230 235 240 

Tyr His Gly He Ser Tyr Thr Gin Lys Phe Gly Asn Ala Ala Tyr Ala 
245 250 255 

Thr Lys Ala Arg Val Gin Leu Leu Arg Asp Tyr Gly Asn Cys Leu Ser 
260 265 270 

Pro Phe Asn Ala Tyr Leu Thr Asn Leu Asn Val Glu Thr Leu His Leu 
275 280 285 
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Arg Met Glu Arg His Ser Glu Asn Ala Leu Lys lie Ala Arg Phe Leu 
290 295 300 



Glu Lys His Glu Asn Val Asp Trp lie Asn Tyr Pro Gly Leu Glu Asp 
305 310 315 320 



Asn Lys Tyr Tyr Glu Asn Ala Lys Lys Tyr Leu Ser Arg Gly Cys Ser 
325 330 335 



Gly Val Leu Ser Phe Gly Val Arg Gly Gly Leu Glu Asn Ala Lys Lys 
340 345 350 



Phe Val Glu Lys Leu Gin lie Ala Ser Leu Val Thr His Val Ser Asp 
355 360 365 



1 Arg Thr Cys Val lie His Pro Ala Ser Thr Thr His Arg Gin Leu 
370 375 380 




Thr Glu Glu Gin Leu lie Ala Ser Gly Val Leu Pro Ser Leu lie Arg 
385 390 395 400 



Leu Ser Val Gly lie Glu Asn Val Glu Asp Leu lie Ala Asp Leu Asn 
405 410 415 



Gin Ala Leu Asn Phe 
420 



<210> 43 

<211> 1272 

2> DNA 

3> Campylobacter jejuni 
<220> 

<221> CDS 

<222> (1) . . (1272) 

<223> 



<400> 43 

atg aat ttc aat aaa gaa act tta gca tta cac gga get tat aat ttt 
Met Asn Phe Asn Lys Glu Thr Leu Ala Leu His Gly Ala Tyr Asn Phe 
15 10 15 

gat act caa aga agt att agt gtg cct ata tat caa aac act gcg tat 
Asp Thr Gin Arg Ser lie Ser Val Pro lie Tyr Gin Asn Thr Ala Tyr 
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20 25 30 

aat ttt gaa aat ttg gat caa get gca gca agg ttt aat ctt caa gaa 144 
Asn Phe Glu Asn Leu Asp Gin Ala Ala Ala Arg Phe Asn Leu Gin Glu 
35 40 45 

ctt ggc aat att tac tea aga ctt age aat cct aca age gat gtt tta 192 
Leu Gly Asn lie Tyr Ser Arg Leu Ser Asn Pro Thr Ser Asp Val Leu 
50 55 60 

gga caa aga ctt get aat gtc gaa gga ggg get ttt gga att cct gtt 24 0 

Gly Gin Arg Leu Ala Asn Val Glu Gly Gly Ala Phe Gly lie Pro Val 
65 70. 75 80 

get age ggt atg gca get tgt ttt tat get ctt ate aat tta gca agt 288 
Ala Ser Gly Met Ala Ala Cys Phe Tyr Ala Leu lie Asn Leu Ala Ser 
85 90 95 

teg gga gat aat gtc gcg tat teg aac aaa att tat ggt ggg act caa 336 
Ser Gly Asp Asn Val Ala Tyr Ser Asn Lys lie Tyr Gly Gly Thr Gin 
100 105 110 

ct tta att tct cac aca ctt aaa aat ttt ggc ata gaa get agg gaa 384 
Thr Leu lie Ser His Thr Leu Lys Asn Phe Gly lie Glu Ala Arg Glu 
115 120 125 

ttt gat ate gat gat tta gat age ttg gaa aaa gtt ata gat caa aac 432 
Phe Asp lie Asp Asp Leu Asp Ser Leu Glu Lys Val lie Asp Gin Asn 
130 135 140 

aca aaa gcg att ttt ttc gaa agt ctt tea aat cct caa att gee ata 480 
Thr Lys Ala lie Phe Phe Glu Ser Leu Ser Asn Pro Gin He Ala He 
145 150 155 160 

get gat ata gaa aaa ata aac caa ata gca aaa aaa cat aaa ate gtt 528 
Ala Asp He Glu Lys He Asn Gin He Ala Lys Lys His Lys He Val 
165 170 175 

age att tgt gat aat ace gtt get act cct ttc tta etc caa cct ttt 576 
Ser He Cys Asp Asn Thr Val Ala Thr Pro Phe Leu Leu Gin Pro Phe 
180 185 190 

a cat ggc gtg gat gta ate gtg cat agt tta agt aaa tat gta age 624 
Lys His Gly Val Asp Val He Val His Ser Leu Ser Lys Tyr Val Ser 
195 200 205 

ggt caa ggc act get ttg ggt gga gca ctt ata gaa aga aaa gat tta 672 
Gly Gin Gly Thr Ala Leu Gly Gly Ala Leu He Glu Arg Lys Asp Leu 
210 215 220 

aac gac ttg ctt aaa aat aac gat aga tat aaa get ttt aac act cct 720 
Asn Asp Leu Leu Lys Asn Asn Asp Arg Tyr Lys Ala Phe Asn Thr Pro 
225 230 235 240 

gat cca agt tat cat gga ctg aat tta aat aca ctt gat ttg ccg att 768 
Asp Pro Ser Tyr His Gly Leu Asn Leu Asn Thr Leu Asp Leu Pro He 
245 250 255 

ttt agt att aga gtc ate ate act tgg ctt aga gat eta gga get age 816 
Phe Ser He Arg Val lie He Thr Trp Leu Arg Asp Leu Gly Ala Ser 
260 265 270 

tta gca cct caa aat get tgg tta ctt tta caa gga ctt gaa ace ttg 864 
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Leu Ala Pro Gin Asn Ala Trp Leu Leu Leu Gin Gly Leu Glu Thr Leu 
275 280 285 

gca gtg cgt ata gaa aaa cac agt caa aat get gaa aaa gtt gcg aat 912 
Ala Val Arg He Glu Lys His Ser Gin Asn Ala Glu Lys Val Ala Asn 
290 295 300 

ttt tta aat tct cat cct gat ate aag ggc gta aat tat cct act tta 960 
Phe Leu Asn Ser His Pro Asp He Lys Gly Val Asn Tyr Pro Thr Leu 
305 310 315 320 

gca agt aat get tat cat aat tta ttt aaa aaa tat ttt gat aaa aat 1008 
Ala Ser Asn Ala Tyr His Asn Leu Phe Lys Lys Tyr Phe Asp Lys Asn 
325 330 335 

ttt get age ggg ctt tta age ttt gaa get aaa gat tat gag cat get 1056 
Phe Ala Ser Gly Leu Leu Ser Phe Glu Ala Lys Asp Tyr Glu His Ala 
340 345 350 

aga aga att tgt gat aaa act caa ctt ttc tta ctt get gca aat ttg 1104 
rg Arg He Cys Asp Lys Thr Gin Leu Phe Leu Leu Ala Ala Asn Leu 
355 360 365 

ggt gat age aag tct ttg ate ate cat cct get tct act act cat teg 1152 
Gly Asp Ser Lys Ser Leu He He His Pro Ala Ser Thr Thr His Ser 
370 375 380 

caa eta age gaa gaa gaa etc caa aaa gca ggc att acg aaa get act 1200 
Gin Leu Ser Glu Glu Glu Leu Gin Lys Ala Gly He Thr Lys Ala Thr 
385 390 395 400 

ata cgc tta age ata gga ctt gaa aat age gat gat ttg ata gcg gat 124 8 

He Arg Leu Ser He Gly Leu Glu Asn Ser Asp Asp Leu He Ala Asp 
405 410 415 

tta aaa caa get ata gaa agt taa 1272 
Leu Lys Gin Ala He Glu Ser 
420 



10> 44 
11> 423 
<212> PRT 

<213> Campylobacter jejuni 
<400> 44 

Met Asn Phe Asn Lys Glu Thr Leu Ala Leu His Gly Ala Tyr Asn Phe 
15 10 15 



Asp Thr Gin Arg Ser He Ser Val Pro He Tyr Gin Asn Thr Ala Tyr 
20 25 30 



Asn Phe Glu Asn Leu Asp Gin Ala Ala Ala Arg Phe Asn Leu Gin Glu 
35 40 45 
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Leu Gly Asn lie Tyr Ser Arg Leu Ser Asn Pro Thr Ser Asp Val Leu 
50 55 60 



Gly Gin Arg Leu Ala Asn Val Glu Gly Gly Ala Phe Gly lie Pro Val 
65 70 75 80 



Ala Ser Gly Met Ala Ala Cys Phe Tyr Ala Leu lie Asn Leu Ala Ser 
85 90 95 



Ser Gly Asp Asn Val Ala Tyr Ser Asn Lys lie Tyr Gly Gly Thr Gin 
100 105 110 



Thr Leu He Ser His Thr Leu Lys Asn Phe Gly He Glu Ala Arg Glu 
115 120 125 



e Asp lie Asp Asp Leu Asp Ser Leu Glu Lys Val lie Asp Gin Asn 
130 135 140 



Thr Lys Ala He Phe Phe Glu Ser Leu Ser Asn Pro Gin He Ala He 
145 150 155 160 



Ala Asp He Glu Lys He Asn Gin He Ala Lys Lys His Lys He Val 
165 170 175 



Ser He Cys Asp Asn Thr Val Ala Thr Pro Phe Leu Leu Gin Pro Phe 
180 185 190 



Lys His Gly Val Asp Val lie Val His Ser Leu Ser Lys Tyr Val Ser 
195 200 205 



Gin Gly Thr Ala Leu Gly Gly Ala Leu He Glu Arg Lys Asp Leu 
210 215 220 



Asn Asp Leu Leu Lys Asn Asn Asp Arg Tyr Lys Ala Phe Asn Thr Pro 
225 230 235 240 



Asp Pro Ser Tyr His Gly Leu Asn Leu Asn Thr Leu Asp Leu Pro He 
245 250 255 



Phe Ser He Arg Val He He Thr Trp Leu Arg Asp Leu Gly Ala Ser 
260 265 270 



Leu Ala Pro Gin Asn Ala Trp Leu Leu Leu Gin Gly Leu Glu Thr Leu 
275 280 285 



Ala Val Arg He Glu Lys His Ser Gin Asn Ala Glu Lys Val Ala Asn 
290 295 300 
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Phe Leu Asn Ser His Pro Asp lie Lys Gly Val Asn Tyr Pro Thr Leu 
305 310 315 320 



Ala Ser Asn Ala Tyr His Asn Leu Phe Lys Lys Tyr Phe Asp Lys Asn 
325 330 335 



Phe Ala Ser Gly Leu Leu Ser Phe Glu Ala Lys Asp Tyr Glu His Ala 
340 345 350 



Arg Arg lie Cys Asp Lys Thr Gin Leu Phe Leu Leu Ala Ala Asn Leu 
355 360 365 



Gly Asp Ser Lys Ser Leu lie lie His Pro Ala Ser Thr Thr His Ser 
370 375 380 



in Leu Ser Glu Glu Glu Leu Gin Lys Ala Gly lie Thr Lys Ala Thr 
385 390 395 400 



lie Arg Leu Ser lie Gly Leu Glu Asn Ser Asp Asp Leu lie Ala Asp 
405 410 415 



Leu Lys Gin Ala lie Glu Ser 
420 



<210> 45 

<211> 1041 

<212> DNA 

13 > Streptococcus pneumoniae 

<220> 

<221> CDS 

<222> (1) . . (1041) 

<223> 



<400> 45 

ttg agg aaa cca ggg aac att tat act cgt ate acc aat cct aca aca 
Leu Arg Lys Pro Gly Asn He Tyr Thr Arg He Thr Asn Pro Thr Thr 
15 10 15 




48 



get gec ctt gaa ggt ggt gtt gaa gcg eta gca aca gca tea ggt atg 96 

Ala Ala Leu Glu Gly Gly Val Glu Ala Leu Ala Thr Ala Ser Gly Met 

20 25 30 

M/43128 MetY 



act gca gtg act tat acg att ttg gcg att gcc cat get ggt gac cat 144 

Thr Ala Val Thr Tyr Thr lie Leu Ala lie Ala His Ala Gly Asp His 
35 40 45 

gta gtg get get teg act att tac ggt gga acc ttc aat ctt ttg aaa 192 

Val Val Ala Ala Ser Thr lie Tyr Gly Gly Thr Phe Asn Leu Leu Lys 
50 55 60 

gaa ccc ctt cct cgt tat ggt ate aca aca acc ttt ttc gat att gat 240 

Glu Pro Leu Pro Arg Tyr Gly lie Thr Thr Thr Phe Phe Asp lie Asp 

65 70 75 80 

aat ttg gag gaa gta gaa gca get ate aaa gac aat acc aag ctt gtc 2 88 

Asn Leu Glu Glu Val Glu Ala Ala He Lys Asp Asn Thr Lys Leu Val 
85 90 95 

ttg att gaa acc ttg ggt aac ccc ttg att aat att cca gac ctg gaa 336 

Leu He Glu Thr Leu Gly Asn Pro Leu He Asn He Pro Asp Leu Glu 
100 105 110 



aa ctg gca gag att get cat aaa cat caa ate cca ctt gtg tea gac 384 
s Leu Ala Glu He Ala His Lys His Gin He Pro Leu Val Ser Asp 
115 120 125 



aat act ttt gca aca cct tat ttg att aac gtc ttc tct cat ggc gtt 432 
Asn Thr Phe Ala Thr Pro Tyr Leu He Asn Val Phe Ser His Gly Val 
130 135 140 

gac att gcc att cac tct gtg act aag ttt ate ggt ggg cat ggt aca 480 
Asp He Ala He His Ser Val Thr Lys Phe He Gly Gly His Gly Thr 
145 150 155 160 

act att gga gga ata att gtc gat agt ggt cgt ttt gac tgg acg get 52 8 

Thr He Gly Gly He He Val Asp Ser Gly Arg Phe Asp Trp Thr Ala 
165 170 175 

tea ggg aaa ttc cct caa ttt gtt gac gag ggt cca age tgc cac aat 576 
Ser Gly Lys Phe Pro Gin Phe Val Asp Glu Gly Pro Ser Cys His Asn 
180 185 190 



k g age tat act cgt gat gtg ggt gca gca gcc ttt att ata get gtt 624 
Ser Tyr Thr Arg Asp Val Gly Ala Ala Ala Phe He He Ala Val 
195 200 205 



cga gtt caa ttg ctt cgt gat aca ggt gca gcc ttg tea cca ttc aat 672 

Arg Val Gin Leu Leu Arg Asp Thr Gly Ala Ala Leu Ser Pro Phe Asn 

210 215 220 

get ttc etc ttg eta caa aga ctt gaa acc tct tea ctt cgt gtg gaa 72 0 

Ala Phe Leu Leu Leu Gin Arg Leu Glu Thr Ser Ser Leu Arg Val Glu 
225 230 235 240 

cgc cat gta caa aat get gag aca att gtt gat ttt ctt gtc aac cat 768 

Arg His Val Gin Asn Ala Glu Thr He Val Asp Phe Leu Val Asn His 
245 250 255 

cct aag gta gaa aag gta aat tat cca aaa ctt gca gat agt cct tat 816 

Pro Lys Val Glu Lys Val Asn Tyr Pro Lys Leu Ala Asp Ser Pro Tyr 
260 265 270 

cat gcc ttg get gag aaa tac ttg cca aaa ggt gtc ggt tea ate ttt 864 
His Ala Leu Ala Glu Lys Tyr Leu Pro Lys Gly Val Gly Ser He Phe 
275 280 285 
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acc ttc cac gtc aaa ggt ggc gag gaa gaa gca cgc aag gtc att gat 912 
Thr Phe His Val Lys Gly Gly Glu Glu Glu Ala Arg Lys Val He Asp 
290 295 300 

aat tta gaa ate ttt tct gac ctt gca aac gcg gca gat get aaa teg 960 
Asn Leu Glu He Phe Ser Asp Leu Ala Asn Ala Ala Asp Ala Lys Ser 
305 310 315 320 

ctt gtt gtc cat cca gca aca acc act cac ggt caa ttg tea gaa aaa 1008 
Leu Val Val His Pro Ala Thr Thr Thr His Gly Gin Leu Ser Glu Lys 
325 330 335 

gac eta gaa gca gca ggt gtc aca cca aac taa 1041 
Asp Leu Glu Ala Ala Gly Val Thr Pro Asn 
340 345 



<210> 46 

11> 346 

"<212> PRT 

<213> Streptococcus pneumoniae 




<400> 46 

Leu Arg Lys Pro Gly Asn He Tyr Thr Arg He Thr Asn Pro Thr Thr 
15 10 15 



Ala Ala Leu Glu Gly Gly Val Glu Ala Leu Ala Thr Ala Ser Gly Met 
20 25 30 



Thr Ala Val Thr Tyr Thr He Leu Ala He Ala His Ala Gly Asp His 
35 40 45 



1 Val Ala Ala Ser Thr He Tyr Gly Gly Thr Phe Asn Leu Leu Lys 
50 55 60 



Glu Pro Leu Pro Arg Tyr Gly He Thr Thr Thr Phe Phe Asp He Asp 
65 70 75 80 



Asn Leu Glu Glu Val Glu Ala Ala He Lys Asp Asn Thr Lys Leu Val 
85 90 95 



Leu He Glu Thr Leu Gly Asn Pro Leu He Asn He Pro Asp Leu Glu 
100 105 110 



Lys Leu Ala Glu He Ala His Lys His Gin He Pro Leu Val Ser Asp 
115 120 125 



Asn Thr Phe Ala Thr Pro Tyr Leu He Asn Val Phe Ser His Gly Val 
M/43128 
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130 



135 



14 0 




Asp He Ala He His Ser Val Thr Lys Phe He Gly Gly His Gly Thr 
145 150 155 160 



Thr He Gly Gly He He Val Asp Ser Gly Arg Phe Asp Trp Thr Ala 
165 170 175 



Ser Gly Lys Phe Pro Gin phe Val Asp Glu Gly Pro Ser Cys His Asn 
180 185 190 



Leu Ser Tyr Thr Arg Asp Val Gly Ala Ala Ala Phe He He Ala Val 
195 200 205 



TVrg Val Gin Leu Leu Arg Asp Thr Gly Ala Ala Leu Ser Pro Phe Asn 
210 215 220 



Ala Phe Leu Leu Leu Gin Arg Leu Glu Thr Ser Ser Leu Arg Val Glu 
225 230 235 240 



Arg His Val Gin Asn Ala Glu Thr He Val Asp Phe Leu Val Asn His 
245 250 255 



Pro Lys Val Glu Lys Val Asn Tyr Pro Lys Leu Ala Asp Ser Pro Tyr 
260 265 270 



His Ala Leu Ala Glu Lys Tyr Leu Pro Lys Gly Val Gly Ser He Phe 
275 280 285 



hr Phe His Val Lys Gly Gly Glu Glu Glu Ala Arg Lys Val He Asp 
290 295 300 



Asn Leu Glu He Phe Ser Asp Leu Ala Asn Ala Ala Asp Ala Lys Ser 
305 310 315 320 



Leu Val Val His Pro Ala Thr Thr Thr His Gly Gin Leu Ser Glu Lys 
325 330 335 



Asp Leu Glu Ala Ala Gly Val Thr Pro Asn 
340 345 



<210> 47 

<211> 1335 

<212> DNA 

<213> Saccharomyces cerevisiae 
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<220> 

<221> CDS 

<222> (1) . . (1335) 

<223> 



<400> 47 

atg cca tct cat ttc gat act gtt caa eta cac gec ggc caa gag aac 

Met Pro Ser His Phe Asp Thr Val Gin Leu His Ala Gly Gin Glu Asn 

15 10 15 

cct ggt gac aat get cac aga tec aga get gta cca att tac gee acc 

Pro Gly Asp Asn Ala His Arg Ser Arg Ala Val Pro lie Tyr Ala Thr 

20 25 30 



t tct tat gtt ttc gaa aac tct aag cat ggt teg caa ttg ttt ggt 
Ser Tyr Val Phe Glu Asn Ser Lys His Gly Ser Gin Leu Phe Gly 
35 40 45 




eta gaa gtt cca ggt tac gtc tat tec cgt ttc caa aac cca acc agt 
Leu Glu Val Pro Gly Tyr Val Tyr Ser Arg Phe Gin Asn Pro Thr Ser 
50 55 60 

aat gtt ttg gaa gaa aga att get get tta gaa ggt ggt get get get 
Asn Val Leu Glu Glu Arg lie Ala Ala Leu Glu Gly Gly Ala Ala Ala 
65 70 75 80 

ttg get gtt tec tec ggt caa gee get caa acc ctt gee ate caa ggt 
Leu Ala Val Ser Ser Gly Gin Ala Ala Gin Thr Leu Ala lie Gin Gly 
85 90 95 

ttg gca cac act ggt gac aac ate gtt tec act tct tac tta tac ggt 
Leu Ala His Thr Gly Asp Asn lie Val Ser Thr Ser Tyr Leu Tyr Gly 
100 105 110 

act tat aac cag ttc aaa ate teg ttc aaa aga ttt ggt ate gag 
y Thr Tyr Asn Gin Phe Lys lie Ser Phe Lys Arg Phe Gly lie Glu 
115 12 0 125 

get aga ttt gtt gaa ggt gac aat cca gaa gaa ttc gaa aag gtc ttt 
Ala Arg Phe Val Glu Gly Asp Asn Pro Glu Glu Phe Glu Lys Val Phe 
130 135 140 

gat gaa aga acc aag get gtt tat ttg gaa acc att ggt aat cca aag 
Asp Glu Arg Thr Lys Ala Val Tyr Leu Glu Thr lie Gly Asn Pro Lys 
145 150 155 160 

tac aat gtt ccg gat ttt gaa aaa att gtt gca att get cac aaa cac 
Tyr Asn Val Pro Asp Phe Glu Lys lie Val Ala lie Ala His Lys His 
165 170 175 

ggt att cca gtt gtc gtt gac aac aca ttt ggt gee ggt ggt tac ttc 
Gly lie Pro Val Val Val Asp Asn Thr Phe Gly Ala Gly Gly Tyr Phe 
180 185 190 

tgt cag cca att aaa tac ggt get gat att gta aca cat tct get acc 
Cys Gin Pro He Lys Tyr Gly Ala Asp He Val Thr His Ser Ala Thr 
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96 



144 



192 



240 



288 



336 



384 



432 



480 



528 



576 



624 
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195 200 205 

aaa tgg att ggt ggt cat ggt act act ate ggt ggt att att gtt gac 

Lys Trp He Gly Gly His Gly Thr Thr He Gly Gly He He Val Asp 
210 215 220 

tct ggt aag ttc cca tgg aag gac tac cca gaa aag ttc cct caa ttc 

Ser Gly Lys Phe Pro Trp Lys Asp Tyr Pro Glu Lys Phe Pro Gin Phe 
225 230 235 240 

tct caa cct gec gaa gga tat cac ggt act ate tac aat gaa gec tac 

Ser Gin Pro Ala Glu Gly Tyr His Gly Thr He Tyr Asn Glu Ala Tyr 
245 250 * 255 

ggt aac ttg gca tac ate gtt cat gtt aga act gaa eta tta aga gat 

Gly Asn Leu Ala Tyr He Val His Val Arg Thr Glu Leu Leu Arg Asp 

260 265 270 



ttg ggt cca ttg atg aac cca ttt gee tct ttc ttg eta eta caa ggt 
£eu Gly Pro Leu Met Asn Pro Phe Ala Ser Phe Leu Leu Leu Gin Gly 
275 280 285 



tt gaa aca tta tct ttg aga get gaa aga cac ggt gaa aat gca ttg 
Val Glu Thr Leu Ser Leu Arg Ala Glu Arg His Gly Glu Asn Ala Leu 
290 295 300 

aag tta gee aaa tgg tta gaa caa tec cca tac gta tct tgg gtt tea 
Lys Leu Ala Lys Trp Leu Glu Gin Ser Pro Tyr Val Ser Trp Val Ser 
305 310 315 ~ 320 

tac cct ggt tta gca tct cat tct cat cat gaa aat get aag aag tat 
Tyr Pro Gly Leu Ala Ser His Ser His His Glu Asn Ala Lys Lys Tyr 
325 330 335 

eta tct aac ggt ttc ggt ggt gtc tta tct ttc ggt gta aaa gac tta 
Leu Ser Asn Gly Phe Gly Gly Val Leu Ser Phe Gly Val Lys Asp Leu 
340 345 350 

cca aat gee gac aag gaa act gac cca ttc aaa ctt tct ggt get caa 
to Asn Ala Asp Lys Glu Thr Asp Pro Phe Lys Leu Ser Gly Ala Gin 
355 360 365 



gtt gac aat tta aag ctt gee tct aac ttg gee aat gtt ggt gat 
Val Val Asp Asn Leu Lys Leu Ala Ser Asn Leu Ala Asn Val Gly Asp 
370 375 380 

gec aag ace tta gtc att get cca tac ttc act ace cac aaa caa tta 
Ala Lys Thr Leu Val He Ala Pro Tyr Phe Thr Thr His Lys Gin Leu 
385 390 395 400 

aat gac aaa gaa aag ttg gca tct ggt gtt ace aag gac tta att cgt 
Asn Asp Lys Glu Lys Leu Ala Ser Gly Val Thr Lys Asp Leu He Arg 
405 410 415 

gtc tct gtt ggt ate gaa ttt att gat gac att att gca gac ttc cag 
Val Ser Val Gly He Glu Phe He Asp Asp He He Ala Asp Phe Gin 
420 425 430 

caa tct ttt gaa act gtt ttc get ggc caa aaa cca tga 
Gin Ser Phe Glu Thr Val Phe Ala Gly Gin Lys Pro 
435 440 
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720 



768 



816 



864 



912 



960 



1008 



1056 



1104 



1152 



1200 



1248 



1296 



1335 
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<210> 48 

<211> 444 

<212> PRT 

<213> Saccharomyces cerevisiae 

<400> 48 

Met Pro Ser His Phe Asp Thr Val Gin Leu His Ala Gly Gin Glu Asn 
! 5 10 15 

Pro Gly Asp Asn Ala His Arg Ser Arg Ala Val Pro lie Tyr Ala Thr 
20 25 30 



hr Ser Tyr Val Phe Glu Asn Ser Lys His Gly Ser Gin Leu Phe Gly 
35 40 45 



Leu Glu Val Pro Gly Tyr Val Tyr Ser Arg Phe Gin Asn Pro Thr Ser 
50 55 60 

Asn Val Leu Glu Glu Arg lie Ala Ala Leu Glu Gly Gly Ala Ala Ala 
65 70 75 80 

Leu Ala Val Ser Ser Gly Gin Ala Ala Gin Thr Leu Ala lie Gin Gly 
85 90 95 

Leu Ala His Thr Gly Asp Asn lie Val Ser Thr Ser Tyr Leu Tyr Gly 
100 105 110 



y Thr Tyr Asn Gin Phe Lys lie Ser Phe Lys Arg Phe Gly lie Glu 
115 120 125 



Ala Arg Phe Val Glu Gly Asp Asn Pro Glu Glu Phe Glu Lys Val Phe 
130 A.35 140 

Asp Glu Arg Thr Lys Ala Val Tyr Leu Glu Thr lie Gly Asn Pro Lys 
145 150 155 160 

Tyr Asn Val Pro Asp Phe Glu Lys lie Val Ala He Ala His Lys His 
165 170 175 



Gly He Pro Val Val Val Asp Asn Thr Phe Gly Ala Gly Gly Tyr Phe 
180 185 190 




Cys Gin Pro He Lys Tyr Gly Ala Asp He Val Thr His Ser Ala Thr 
195 200 205 
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Lys Trp lie Gly Gly His Gly Thr Thr lie Gly Gly lie He Val Asp 
210 215 220 



Ser Gly Lys Phe Pro Trp Lys Asp Tyr Pro Glu Lys Phe Pro Gin Phe 
225 230 235 240 



Ser Gin Pro Ala Glu Gly Tyr His Gly Thr He Tyr Asn Glu Ala Tyr 
245 250 255 



Gly Asn Leu Ala Tyr He Val His Val Arg Thr Glu Leu Leu Arg Asp 
260 265 270 




Leu Gly Pro Leu Met Asn Pro Phe Ala Ser Phe Leu Leu Leu Gin Gly 
275 280 285 



1 Glu Thr Leu Ser Leu Arg Ala Glu Arg His Gly Glu Asn Ala Leu 
290 295 300 



Lys Leu Ala Lys Trp Leu Glu Gin Ser Pro Tyr Val Ser Trp Val Ser 
305 310 315 320 



Tyr Pro Gly Leu Ala Ser His Ser His His Glu Asn Ala Lys Lys Tyr 
325 330 335 



Leu Ser Asn Gly Phe Gly Gly Val Leu Ser Phe Gly Val Lys Asp Leu 
340 345 350 



Pro Asn Ala Asp Lys Glu Thr Asp Pro Phe Lys Leu Ser Gly Ala Gin 
355 360 365 



Val Asp Asn Leu Lys Leu Ala Ser Asn Leu Ala Asn Val Gly Asp 
370 375 380 




Ala Lys Thr Leu Val He Ala Pro Tyr Phe Thr Thr His Lys Gin Leu 
385 390 395 400 



Asn Asp Lys Glu Lys Leu Ala Ser Gly Val Thr Lys Asp Leu He Arg 
405 410 415 



Val Ser Val Gly He Glu Phe He Asp Asp He He Ala Asp Phe Gin 
420 425 430 



Gin Ser Phe Glu Thr Val Phe Ala Gly Gin Lys Pro 
435 440 



<210> 49 
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<211> 1335 

<212> DNA 

<213> Kluyveromyces lactis 
<220> 

<221> CDS 

<222> (1) . . (1335) 

<223> 



<400> 49 

atg cca tct cac ttc gat act ttg caa ttg cac get ggt caa gaa aag 48 
t Pro Ser His Phe Asp Thr Leu Gin Leu His Ala Gly Gin Glu Lys 
5 10 15 



act get gat get cat aac cca aga gec gtc cca att tac get ace act 96 
Thr Ala Asp Ala His Asn Pro Arg Ala Val Pro lie Tyr Ala Thr Thr 
20 25 30 

tct tac gtc ttc aac gac tct aag cat ggt get caa ttg ttc ggt tta 144 
Ser Tyr Val Phe Asn Asp Ser Lys His Gly Ala Gin Leu Phe Gly Leu 
35 40 45 

gaa act cca ggt tac att tac tct cgt att atg aac cct act eta gac 192 
Glu Thr Pro Gly Tyr lie Tyr Ser Arg lie Met Asn Pro Thr Leu Asp 
50 55 60 

gtc ttg gaa aag aga ttg gca gee tta gaa ggt ggt att get get ttg 240 
Val Leu Glu Lys Arg Leu Ala Ala Leu Glu Gly Gly lie Ala Ala Leu 
65 70 75 80 



act 



ct act tct tct ggc caa get get caa acc ttg get gtc act ggt ttg 2 88 

Thr Ser Ser Gly Gin Ala Ala Gin Thr Leu Ala Val Thr Gly Leu 
85 90 95 



gee cac act ggt gac aat att gtc tct acc tct ttc tta tac ggt ggt 3 36 

Ala His Thr Gly Asp Asn lie Val Ser Thr Ser Phe Leu Tyr Gly Gly 
100 105 110 

act tat aac caa ttc aag gtt gee ttc aag aga tta gga att gaa get 3 84 

Thr Tyr Asn Gin Phe Lys Val Ala Phe Lys Arg Leu Gly lie Glu Ala 
115 120 125 

aga ttt gtc gat ggt gac aag cca gaa gac ttc gaa aag ttg ttc gat 432 
Arg Phe Val Asp Gly Asp Lys Pro Glu Asp Phe Glu Lys Leu Phe Asp 
130 135 140 



gaa aag act aag get etc tat ctg gaa tct ate ggt aat cct aag tac 
Glu Lys Thr Lys Ala Leu Tyr Leu Glu Ser lie Gly Asn Pro Lys Tyr 
145 150 155 160 



480 



aat gtc cca gac ttc gaa aag att gtt get gtt get cat aag cat ggt 528 

Asn Val Pro Asp Phe Glu Lys lie Val Ala Val Ala His Lys His Gly 
165 170 175 
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ate cca gtt gtt gtt gac aac act ttc ggt gec ggt ggt ttc ttc tgc 576 

lie Pro Val Val Val Asp Asn Thr Phe Gly Ala Gly Gly Phe Phe Cys 
180 185 190 

caa cct ate aaa tac ggt get gat ate gtt act cac tct get ace aag 624 
Gin Pro lie Lys Tyr Gly Ala Asp lie Val Thr His Ser Ala Thr Lys 
195 200 205 

tgg ate ggt ggt cat ggt gtc acc gtt ggt ggt gtc ate att gac tct 672 
Trp He Gly Gly His Gly Val Thr Val Gly Gly Val He He Asp Ser 
210 215 220 

ggt aag ttc cca tgg aag gat tac ccg gaa aag ttc cct caa ttc tct 720 
Gly Lys Phe Pro Trp Lys Asp Tyr Pro Glu Lys Phe Pro Gin Phe Ser 
225 230 235 240 



cag cca tct gaa ggt tat cat ggt ttg ate ttc aat gat gec ttt ggt 768 
Gin Pro Ser Glu Gly Tyr His Gly Leu He Phe Asn Asp Ala Phe Gly 
245 250 255 



• 



a get get ttc att ggt cat gta aga acc gaa ttg eta aga gat tta 816 
o Ala Ala Phe He Gly His Val Arg Thr Glu Leu Leu Arg Asp Leu 
260 265 270 



ggt cca gtg ttg agt cca ttc get ggt ttc ttg ttg tta cag ggt ctt 864 

Gly Pro Val Leu Ser Pro Phe Ala Gly Phe Leu Leu Leu Gin Gly Leu 
275 280 285 

gaa act ttg tct eta aga ggt gaa jaga cac ggt tec aac get ttg aag 912 
Glu Thr Leu Ser Leu Arg Gly Glu Arg His Gly Ser Asn Ala Leu Lys 

290 295 300 

ttg get caa tac ttg gaa agt tct cca tac gtt tea tgg gtc tct tac 960 

Leu Ala Gin Tyr Leu Glu Ser Ser Pro Tyr Val Ser Trp Val Ser Tyr 
305 310 315 320 



cca ggt ttg cca tct cac tct cac cac gaa aac get aag aaa tac ttg 
Pro Gly Leu Pro Ser His Ser His His Glu Asn Ala Lys Lys Tyr Leu 
325 330 335 



# 



1008 



aat ggt ttc ggt ggt gtt tta tec ttc ggt gtc aaa gat ttg cct 1056 
Asn Gly Phe Gly Gly Val Leu Ser Phe Gly Val Lys Asp Leu Pro 
340 345 350 



aac get tec gag gaa tct gat cca ttc aag get tct ggt gee caa gtt 1104 
Asn Ala Ser Glu Glu Ser Asp Pro Phe Lys Ala Ser Gly Ala Gin Val 
355 360 365 

gtt gac aac ttg aag ctg get tct aac ttg gca aac gtt ggt gac tec 1152 
Val Asp Asn Leu Lys Leu Ala Ser Asn Leu Ala Asn Val Gly Asp Ser 
370 375 380 

aag acc ttg gtc att get cca tac ttc act aca cat caa caa ttg acc 1200 
Lys Thr Leu Val He Ala Pro Tyr Phe Thr Thr His Gin Gin Leu Thr 
385 390 395 400 

gac gaa gaa aag tta get tct ggt gtt acc aag gac ttg ate cgt gtt 1248 
Asp Glu Glu Lys Leu Ala Ser Gly Val Thr Lys Asp Leu He Arg Val 
405 410 415 

tct gtt ggt act gaa ttc att gac gac att att get gac ttt gaa gca 12 96 

Ser Val Gly Thr Glu Phe He Asp Asp He He Ala Asp Phe Glu Ala 
420 425 430 
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tct ttc get act gtc ttc aat ggc caa aaa cct gaa taa 1335 
Ser Phe Ala Thr Val Phe Asn Gly Gin Lys Pro Glu 
435 440 



<210> 50 

<211> 444 

<212> PRT 

<213> Kluyveromyces lactis 

<400> 50 

Met Pro Ser His Phe Asp Thr Leu Gin Leu His Ala Gly Gin Glu Lys 
1 5 10 15 

Lr Ala Asp Ala His Asn Pro Arg Ala Val Pro lie Tyr Ala Thr Thr 
20 25 30 

Ser Tyr Val Phe Asn Asp Ser Lys His Gly Ala Gin Leu Phe Gly Leu 
35 40 45 

Glu Thr Pro Gly Tyr lie Tyr Ser Arg lie Met Asn Pro Thr Leu Asp 
50 55 60 

Val Leu Glu Lys Arg Leu Ala Ala Leu Glu Gly Gly lie Ala Ala Leu 
65 70 75 80 

Ala Thr Ser Ser Gly Gin Ala Ala Gin Thr Leu Ala Val Thr Gly Leu 
85 90 95 

r a His Thr Gly Asp Asn He Val Ser Thr Ser Phe Leu Tyr Gly Gly 
100 ■ 105 110 

Thr Tyr Asn Gin Phe Lys Val Ala Phe Lys Arg Leu Gly He Glu Ala 
115 120 125 

Arg Phe Val Asp Gly Asp Lys Pro Glu Asp Phe Glu Lys Leu Phe Asp 
130 135 140 

Glu Lys Thr Lys Ala Leu Tyr Leu Glu Ser He Gly Asn Pro Lys Tyr 
145 150 155 160 

Asn Val Pro Asp Phe Glu Lys He Val Ala Val Ala His Lys His Gly 
165 170 175 

He Pro Val Val Val Asp Asn Thr Phe Gly Ala Gly Gly Phe Phe Cys 
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180 



185 



190 




Gin Pro lie Lys Tyr Gly Ala Asp lie Val Thr His Ser Ala Thr Lys 
195 200 205 



Trp He Gly Gly His Gly Val Thr Val Gly Gly Val He He Asp Ser 
210 215 220 



Gly Lys Phe Pro Trp Lys Asp Tyr Pro Glu Lys Phe Pro Gin Phe Ser 
225 230 235 240 



Gin Pro Ser Glu Gly Tyr His Gly Leu He Phe Asn Asp Ala Phe Gly 
245 250 255 



Pro Ala Ala Phe He Gly His Val Arg Thr Glu Leu Leu Arg Asp Leu 
260 265 270 



Gly Pro Val Leu Ser Pro Phe Ala Gly Phe Leu Leu Leu Gin Gly Leu 
275 280 285 



Glu Thr Leu Ser Leu Arg Gly Glu Arg His Gly Ser Asn Ala Leu Lys 
290 295 300 



Leu Ala Gin Tyr Leu Glu Ser Ser Pro Tyr Val Ser Trp Val Ser Tyr 
305 310 315 320 



Pro Gly Leu Pro Ser His Ser His His Glu Asn Ala Lys Lys Tyr Leu 
325 330 335 



Glu Asn Gly Phe Gly Gly Val Leu Ser Phe Gly Val Lys Asp Leu Pro 
340 345 350 



Asn Ala Ser Glu Glu Ser Asp Pro Phe Lys Ala Ser Gly Ala Gin Val 
355 360 365 



Val Asp Asn Leu Lys Leu Ala Ser Asn Leu Ala Asn Val Gly Asp Ser 
370 375 380 



Lys Thr Leu Val He Ala Pro Tyr Phe Thr Thr His Gin Gin Leu Thr 
385 390 395 400 



Asp Glu Glu Lys Leu Ala Ser Gly Val Thr Lys Asp Leu He Arg Val 
405 410 415 




Ser Val Gly Thr Glu Phe He Asp Asp He He Ala Asp Phe Glu Ala 
420 425 430 
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Ser Phe Ala Thr Val Phe Asn Gly Gin Lys Pro Glu 
435 440 

<210> 51 

<211> 1323 

<212> DNA 

<213> Candida albicans 




<220> 
<221> CDS 
<222> (1) . . (1323) 
223> 



<400> 51 

atg cct tct cac ttt gat aca ctt caa tta cat get ggt caa cca gtt 4 8 

Met Pro Ser His Phe Asp Thr Leu Gin Leu His Ala Gly Gin Pro Val 

15 10 15 

gaa aaa cca cac caa cca aga gec cca cca att tat gca acc acc tec 96 
Glu Lys Pro His Gin Pro Arg Ala Pro Pro lie Tyr Ala Thr Thr Ser 
20 25 ~ 30 

tat gtt ttc aat gac tct aaa cac ggt get caa tta ttt ggt tta gaa 144 
Tyr Val Phe Asn Asp Ser Lys His Gly Ala Gin Leu Phe Gly Leu Glu 
35 40 45 

acc cca gga tac att tac tec aga att atg aat cca aca aac gat gtg 192 
Thr Pro Gly Tyr lie Tyr Ser Arg lie Met Asn Pro Thr Asn Asp Val 
50 55 60 




gaa caa aga att get gee ttg gaa ggt ggt att ggt gca ttg gec 240 
fe Glu Gin Arg lie Ala Ala Leu Glu Gly Gly He Gly Ala Leu Ala 
65 70 75 80 

act tct tct ggt caa tea get caa ttc ttg gee att get ggg ttg get 2 88 

Thr Ser Ser Gly Gin Ser Ala Gin Phe Leu Ala He Ala Gly Leu Ala 
85 90 95 

cat get ggt gat aac att ate agt aca tec tac ttg tat ggt ggt act 336 
His Ala Gly Asp Asn He He Ser Thr Ser Tyr Leu Tyr Gly Gly Thr 
100 105 110 

tat aat caa ttc aaa gtt get ttc aaa cgt ttg ggc att gaa acc aaa 384 
Tyr Asn Gin Phe Lys Val Ala Phe Lys Arg Leu Gly He Glu Thr Lys 
115 120 125 

ttc gtt aat ggt gac gee get gaa gat ttt get aaa ttg att gac gac 432 
Phe Val Asn Gly Asp Ala Ala Glu Asp Phe Ala Lys Leu He Asp Asp 
130 135 140 

aag aca aaa get att tat att gaa acc att gga aac cct aaa tat aat 480 
Lys Thr Lys Ala He Tyr He Glu Thr He Gly Asn Pro Lys Tyr Asn 
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145 150 155 160 

gtt ccg gac ttt gaa aaa ate acc aaa ttg gec cat gaa cac ggt att 

Val Pro Asp Phe Glu Lys He Thr Lys Leu Ala His Glu His Gly He 

165 170 175 

cct gtt gtt gtc gac aac act ttt ggt get ggt gga ttt tta gtt aac 

Pro Val Val Val Asp Asn Thr Phe Gly Ala Gly Gly Phe Leu Val Asn 

180 185 190 

cca att gec cac ggt get gat att gtt gtt cat tct get act aaa tgg 

Pro He Ala His Gly Ala Asp lie Val Val His Ser Ala Thr Lys Trp 

195 200 205 

att ggt ggt cac ggt act aca att get ggt gtt att gtt gat tec ggt 

He Gly Gly His Gly Thr Thr He Ala Gly Val He Val Asp Ser Gly 

210 215 220 

aac ttc cca tgg acc gag tac cca gaa aaa tac cca caa ttc tct aaa 

Asn Phe Pro Trp Thr Glu Tyr Pro Glu Lys Tyr Pro Gin Phe Ser Lys 

"\25 230 235 240 

ca tea gaa ggt tac cac ggg ttg ate ttg aat gat get tta ggt aag 

Pro Ser Glu Gly Tyr His Gly Leu He Leu Asn Asp Ala Leu Gly Lys 

245 250 255 

gee gca tac att ggt cac ttg aga att gaa ttg ttg aga gac ttg ggt 

Ala Ala Tyr He Gly His Leu Arg He Glu Leu Leu Arg Asp Leu Gly 

260 265 270 

cca get ttg aat cca ttt gga agt ttt ttg ttg ttg caa ggt tta gaa 

Pro Ala Leu Asn Pro Phe Gly Ser Phe Leu Leu Leu Gin Gly Leu Glu 

275 280 285 

act ttg tct ttg aga gtt gaa aga caa tct gaa aat get ttg aaa ttg 

Thr Leu Ser Leu Arg Val Glu Arg Gin Ser Glu Asn Ala Leu Lys Leu 

290 295 300 

gec caa tgg ttg gaa aag aac cca aat gtt gag tct gtg tec tat ttg 

Ala Gin Trp Leu Glu Lys Asn Pro Asn Val Glu Ser Val Ser Tyr Leu 

310 315 320 




a ttg cca tct cac gaa tec cac gaa ttg agt aaa aaa tac ttg aac 
Gly Leu Pro Ser His Glu Ser His Glu Leu Ser Lys Lys Tyr Leu Asn 
325 330 335 

aat gac get aag tac ttt ggt ggt get tta gca ttt act gtc aag gac 
Asn Asp Ala Lys Tyr Phe Gly Gly Ala Leu Ala Phe Thr Val Lys Asp 
340 345 350 

ate acc aac acc tec age gac cca ttc aat gaa gec tea cca aag ttg 
He Thr Asn Thr Ser Ser Asp Pro Phe Asn Glu Ala Ser Pro Lys Leu 
355 360 365 

gtt gac aat ttg gag att get tea aac ttg get aat gtg ggt gac tct 
Val Asp Asn Leu Glu lie Ala Ser Asn Leu Ala Asn Val Gly Asp Ser 
370 375 380 

aag act ttg gtt att get cca tgg ttt act aca cat caa caa ttg tct 
Lys Thr Leu Val He Ala Pro Trp Phe Thr Thr His Gin Gin Leu Ser 
385 390 395 400 



gat gaa gaa aag ttg get tct ggt gtt acc aag ggc tta ate aga gtt 
M/43128 



528 

576 

624 

672 

720 

768 

816 

864 

912 

960 
1008 
1056 
1104 
1152 
1200 
1248 
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Asp Glu Glu Lys Leu Ala Ser Gly Val Thr Lys Gly Leu lie Arg Val 
405 410 415 



tct act ggt act gaa tat att gat gat att att aac gac ttt gaa caa 
Ser Thr Gly Thr Glu Tyr lie Asp Asp lie He Asn Asp Phe Glu Gin 
420 425 430 



1296 



gca ttc aag aag gtt tat aac aac taa 
Ala Phe Lys Lys Val Tyr Asn Asn 
435 440 



1323 




<210> 52 

<211> 440 

<212> PRT 

<213> Candida albicans 



400> 52 



Met Pro Ser His Phe Asp Thr Leu Gin Leu His Ala Gly Gin Pro Val 
15 10 15 



Glu Lys Pro His Gin Pro Arg Ala Pro Pro He Tyr Ala Thr Thr Ser 
20 25 30 



Tyr Val Phe Asn Asp Ser Lys His Gly Ala Gin Leu Phe Gly Leu Glu 
35 40 45 



Thr Pro Gly Tyr He Tyr Ser Arg He Met Asn Pro Thr Asn Asp Val 
50 55 60 



e Glu Gin Arg He Ala Ala Leu Glu Gly Gly He Gly Ala Leu Ala 

70 75 80 



Thr Ser Ser Gly Gin Ser Ala Gin Phe Leu Ala He Ala Gly Leu Ala 
85 90 95 



His Ala Gly Asp Asn He He Ser Thr Ser Tyr Leu Tyr Gly Gly Thr 
100 105 110 



Tyr Asn Gin Phe Lys Val Ala Phe Lys Arg Leu Gly He Glu Thr Lys 
115 120 * 125 



Phe Val Asn Gly Asp Ala Ala Glu Asp Phe Ala Lys Leu He Asp Asp 
130 135 140 




Lys Thr Lys Ala He Tyr He Glu Thr He Gly Asn Pro Lys Tyr Asn 
145 150 155 160 
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Val Pro Asp Phe Glu Lys He Thr Lys Leu Ala His Glu His Gly He 
165 170 175 



Pro Val Val Val Asp Asn Thr Phe Gly Ala Gly Gly Phe Leu Val Asn 
180 185 190 



Pro He Ala His Gly Ala Asp He Val Val His Ser Ala Thr Lys Trp 
195 200 205 



He Gly Gly His Gly Thr Thr He Ala Gly Val He Val Asp Ser Gly 
210 215 220 



Asn Phe Pro Trp Thr Glu Tyr Pro Glu Lys Tyr Pro Gin Phe Ser Lys 
225 230 235 240 



o Ser Glu Gly Tyr His Gly Leu He Leu Asn Asp Ala Leu Gly Lys 
245 250 255 



Ala Ala Tyr He Gly His Leu Arg He Glu Leu Leu Arg Asp Leu Gly 
260 265 270 



Pro Ala Leu Asn Pro Phe Gly Ser Phe Leu Leu Leu Gin Gly Leu Glu 
275 280 285 



Thr Leu Ser Leu Arg Val Glu Arg Gin Ser Glu Asn Ala Leu Lys Leu 
290 295 300 



Ala Gin Trp Leu Glu Lys Asn Pro Asn Val Glu Ser Val Ser Tyr Leu 
305 310 315 320 



Leu Pro Ser His Glu Ser His Glu Leu Ser Lys Lys Tyr Leu Asn 
325 330 335 



Asn Asp Ala Lys Tyr Phe Gly Gly Ala Leu Ala Phe Thr Val Lys Asp 
340 345 350 



He Thr Asn Thr Ser Ser Asp Pro Phe Asn Glu Ala Ser Pro Lys Leu 
355 360 365 



Val Asp Asn Leu Glu He Ala Ser Asn Leu Ala Asn Val Gly Asp Ser 
370 375 380 



Lys Thr Leu Val He Ala Pro Trp Phe Thr Thr His Gin Gin Leu Ser 
385 390 395 400 



Asp Glu Glu Lys Leu Ala Ser Gly Val Thr Lys Gly Leu He Arg Val 
405 410 ~ 415 
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Ser Thr Gly Thr Glu Tyr lie Asp Asp lie lie Asn Asp Phe Glu Gin 
420 425 430 

Ala Phe Lys Lys Val Tyr Asn Asn 
435 440 

<210> 53 

<211> 1290 

<212> DNA 

<213> Schizosaccharomyces pombe 

•k220> 
*221> CDS 

<222> (1)..(1290) 
<223> 



<400> 53 

atg cca gtc gag agt gaa cat ttc gaa act tta caa tta cat get ggc 4 8 

Met Pro Val Glu Ser Glu His Phe Glu Thr Leu Gin Leu His Ala Gly 
15 10 15 

caa gag cct gat get get ace age tct cgt gee gtt ccc ate tac get 96 

Gin Glu Pro Asp Ala Ala Thr Ser Ser Arg Ala Val Pro lie Tyr Ala 

20 25 30 



act act tec tat gtt ttc cgt gat tgc gac cat ggc ggc cgc ttg ttc 144 
Thr Ser Tyr Val Phe Arg Asp Cys Asp His Gly Gly Arg Leu Phe 
35 40 45 



gga tta cag gaa cca ggt tac ate tac teg cgt atg atg aat ccc ace 192 
Gly Leu Gin Glu Pro Gly Tyr lie Tyr Ser Arg Met Met Asn Pro Thr 
50 55 60 

gee gac gtt ttt gag aaa cgt att gee gee ttg gag cat ggc get get 240 
Ala Asp Val Phe Glu Lys Arg He Ala Ala Leu Glu His Gly Ala Ala 
65 70 75 80 

gca ate get act agt tec ggt act tec get etc ttc atg get ttg ace 288 
Ala He Ala Thr Ser Ser Gly Thr Ser Ala Leu Phe Met Ala Leu Thr 
85 90 95 

acg ttg get aag gee ggt gat aac att gtc tec act tct tac ctt tat 336 
Thr Leu Ala Lys Ala Gly Asp Asn He Val Ser Thr Ser Tyr Leu Tyr 
100 105 110 

ggt ggt act tac aac etc ttc aag gtt acc ctg cct aga ttg gga att 384 
Gly Gly Thr Tyr Asn Leu Phe Lys Val Thr Leu Pro Arg Leu Gly He 
115 120 125 
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act acc aag ttt gtc aat ggt gat gat cct aat gat ctt gca get cag 432 
Thr Thr Lys Phe Val Asn Gly Asp Asp Pro Asn Asp Leu Ala Ala Gin 
130 135 140 



att gat gaa aac aca aag get gtt tac gtt gag tec ate ggc aat ccc 
He Asp Glu Asn Thr Lys Ala Val Tyr Val Glu Ser He Gly Asn Pro 



145 150 155 



160 



• 




320 



480 



atg tac aac gtt ccc gat ttt gag cgt ate get gag gtt get cat gec 52 8 

Met Tyr Asn Val Pro Asp Phe Glu Arg He Ala Glu Val Ala His Ala 
165 170 175 

get ggt gtg cct tta atg gtc gat aac act ttt ggc ggc ggt ggt tat 576 

Ala Gly Val Pro Leu Met Val Asp Asn Thr Phe Gly Gly Gly Gly Tyr 

180 185 ~ 190 

ttg gtt cgt ccc att gac cac ggt gee gat ate gtt acc cac tct gee 624 

Leu Val Arg Pro He Asp His Gly Ala Asp He Val Thr His Ser Ala 
195 200 205 



t aag tgg ate ggt ggt cat ggc act act att ggc ggt gtg att gtt 672 
x Lys Trp He Gly Gly His Gly Thr Thr He Gly Gly Val He Val 
210 215 220 

gat agt ggt aag ttt gac tgg aag aag aac age aag cgt ttc cct gaa 72 0 

Asp Ser Gly Lys Phe Asp Trp Lys Lys Asn Ser Lys Arg Phe Pro Glu 
225 230 235 240 

ttc aac gag cct cat ccc ggt tac cat ggc atg gtc ttt act gaa act 768 
Phe Asn Glu Pro His Pro Gly Tyr His Gly Met Val Phe Thr Glu Thr 
245 250 255 

ttt ggt aac ttg gca tat get ttt get tgc cgt act caa act etc cgt 816 
Phe Gly Asn Leu Ala Tyr Ala Phe Ala Cys Arg Thr Gin Thr Leu Arg 
260 265 270 

gat gtt ggt ggc aat gec aat cca ttc ggt gtc ttt ttg ctt ctt caa 864 
Asp Val Gly Gly Asn Ala Asn Pro Phe Gly Val Phe Leu Leu Leu Gin 
275 280 285 

ctt gaa acg ctt tct ctt cgt atg gag cgt cac gtt caa aat gca 912 
Leu Glu Thr Leu Ser Leu Arg Met Glu Arg His Val Gin Asn Ala 
290 295 300 

ttt get ctt gca aaa tat ttg gaa aag cac ccc aag gtt aac tgg gtt 
Phe Ala Leu Ala Lys Tyr Leu Glu Lys His Pro Lys Val Asn Trp Val 
305 310 315 



960 



tct tac cct ggt ctt gaa tct cac gtc tct cac aaa ctt gee aag aag 1008 

Ser Tyr Pro Gly Leu Glu Ser His Val Ser His Lys Leu Ala Lys Lys 

325 ? 330 335 

tac ttg aaa aat ggt tac ggc gee gtt etc age ttt ggc get aaa ggt 1056 

Tyr Leu Lys Asn Gly Tyr Gly Ala Val Leu Ser Phe Gly Ala Lys Gly 

340 345 " 350 

ggc cct gat caa agt cgt aag gta gtc aat gec tta aag ctt get agt 1104 

Gly Pro Asp Gin Ser Arg Lys Val Val Asn Ala Leu Lys Leu Ala Ser 
355 360 365 

cag ttg gec aat gtt ggt gat gec aaa act ttg gtt ate get cct gee 1152 

Gin Leu Ala Asn Val Gly Asp Ala Lys Thr Leu Val He Ala Pro Ala 
370 375 380 
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tat acc act cat tta caa tta act gat gag gag caa att tct gcc ggt 
Tyr Thr Thr His Leu Gin Leu Thr Asp Glu Glu Gin lie Ser Ala Gly 
385 390 395 400 



1200 



gtc act aag gat ctt att cgt gtg gcc gtc ggt att gag cac ate gat 
Val Thr Lys Asp Leu lie Arg Val Ala Val Gly He Glu His He Asp 
405 410 415 



1248 



gat att ate gcc gac ttt get caa get ttg gaa gtt gcc taa 
Asp He He Ala Asp Phe Ala Gin Ala Leu Glu Val Ala 
420 425 



1290 



<210> 54 
<211> 429 



<212> PRT 

13> Schizosaccharomyces pombe 



<400> 54 

Met Pro Val Glu Ser Glu His Phe Glu Thr Leu Gin Leu His Ala Gly 
15 10 15 



Gin Glu Pro Asp Ala Ala Thr Ser Ser Arg Ala Val Pro He Tyr Ala 
20 25 30 



Thr Thr Ser Tyr Val Phe Arg Asp Cys Asp His Gly Gly Arg Leu Phe 
35 40 45 



Gly Leu Gin Glu Pro Gly Tyr He Tyr Ser Arg Met Met Asn Pro Thr 
50 55 60 



a Asp Val Phe Glu Lys Arg He Ala Ala Leu Glu His Gly Ala Ala 
65 70 75 80 




Ala He Ala Thr Ser Ser Gly Thr Ser Ala Leu Phe Met Ala Leu Thr 
85 90 95 



Thr Leu Ala Lys Ala Gly Asp Asn He Val Ser Thr Ser Tyr Leu Tyr 
100 105 110 



Gly Gly Thr Tyr Asn Leu Phe Lys Val Thr Leu Pro Arg Leu Gly He 
115 120 125 



Thr Thr Lys Phe Val Asn Gly Asp Asp Pro Asn Asp Leu Ala Ala Gin 
130 135 140 



He Asp Glu Asn Thr Lys Ala Val Tyr Val Glu Ser He Gly Asn Pro 
M/43128 
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145 



150 



155 



160 




Met Tyr Asn Val Pro Asp Phe Glu Arg He Ala Glu Val Ala His Ala 
165 170 175 



Ala Gly Val Pro Leu Met Val Asp Asn Thr Phe Gly Gly Gly Gly Tyr 
180 185 190 



Leu Val Arg Pro He Asp His Gly Ala Asp He Val Thr His Ser Ala 
195 200 205 



Thr Lys Trp He Gly Gly His Gly Thr Thr He Gly Gly Val He Val 
210 215 220 



Asp Ser Gly Lys Phe Asp Trp Lys Lys Asn Ser Lys Arg Phe Pro Glu 
" 25 230 235 240 



Phe Asn Glu Pro His Pro Gly Tyr His Gly Met Val Phe Thr Glu Thr 
245 250 255 



Phe Gly Asn Leu Ala Tyr Ala Phe Ala Cys Arg Thr Gin Thr Leu Arg 
260 265 270 



Asp Val Gly Gly Asn Ala Asn Pro Phe Gly Val Phe Leu Leu Leu Gin 
275 280 285 



Gly Leu Glu Thr Leu Ser Leu Arg Met Glu Arg His Val Gin Asn Ala 
290 295 300 




Phe Ala Leu Ala Lys Tyr Leu Glu Lys His Pro Lys Val Asn Trp Val 
^ 5 310 315 320 



Ser Tyr Pro Gly Leu Glu Ser His Val Ser His Lys Leu Ala Lys Lys 
325 330 335 



Tyr Leu Lys Asn Gly Tyr Gly Ala Val Leu Ser Phe Gly Ala Lys Gly 
340 345 350 



Gly Pro Asp Gin Ser Arg Lys Val Val Asn Ala Leu Lys Leu Ala Ser 
355 360 365 



Gin Leu Ala Asn Val Gly Asp Ala Lys Thr Leu Val He Ala Pro Ala 
370 375 380 



Tyr Thr Thr His Leu Gin Leu Thr Asp Glu Glu Gin He Ser Ala Gly 
385 390 395 400 
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Val Thr Lys Asp Leu He Arg Val Ala Val Gly He Glu His He Asp 
405 410 415 



Asp He He Ala Asp Phe Ala Gin Ala Leu Glu Val Ala 
420 425 



<210> 55 
<211> 52 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 55 

cccgggatcc gctagcggcg cgccggccgg cccggtgtga aataccgcac ag 



210> 56 
211> 53 
•<212> DNA 
<213> Kunstliche Sequenz 

<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 56 

tctagactcg agcggccgcg gccggccttt aaattgaaga cgaaagggcc teg 



<210> 57 
<21X> 47 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 



• 



00> 57 

atctaga cccggggatc cgctagcggg ctgetaaagg aagcgga 



<210> 58 
<211> 38 
<212> DNA 

<213> Kunstliche Sequenz 
<2.20> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 58 

gagaggegeg ccgctagcgt gggcgaagaa ctccagca 



<210> 59 
<211> 34 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 



M/43128 




<400> 59 

gagagggcgg ccgcgcaaag tc'ccgcttcg tgaa 34 

<210> 60 
<211> 34 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 60 

gagagggcgg ccgctcaagt cggtcaagcc acgc 34 



W2 



<210> 61 
<211> 140 
<212> DNA 

13 > Kunstliche Sequenz 



220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 61 

tcgaatttaa atctcgagag gcctgacgtc gggcccggta ccacgcgtca tatgactagt 60 
tcggacctag ggatatcgtc gacatcgatg ctcttctgcg ttaattaaca attgggatcc 120 
tctagacccg ggatttaaat 140 



<210> 62 

<211> 140 

<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 62 

•tcatttaa atcccgggtc tagaggatcc caattgttaa ttaacgcaga agagcatcga 60 
legacgat atccctaggt ccgaactagt catatgacgc gtggtaccgg gcccgacgtc 120 
gcctctcg agatttaaat 140 



<210> 63 
<211> 33 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 63 

gagagcggcc gccgatcctt tttaacccat cac 33 



<210> 64 

<211> 32 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 
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<223> Beschreibung der kunstlichen Sequenz:PCR primer 
<400> 64 

aggagcggcc gccatcggca ttttcttttg eg 32 



<210> 65 
<211> 5091 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Seguenz : Plasmid 



<400> 65 
gccgcgactg 
acccctatgc 
tettegcaaa 
gcttggcttg 
cjggcccggta 
fettctgeg 
gctaaagg 
aatgtcagc 
agettgeagt 
aceggaattg 
gatggctttc 
aggatgagga 
ttgggtggag 
cgccgtgttc 
cggtgccctg 
cgttccttgc 
gggcgaagtg 
catcatggct 
ccaccaagcg 
tcaggatgat 
caaggcgcgc 
gaatatcatg 
ggcggaccgc 
cgaatgggct 
cgccttctat 
peaagega 
ttgggct 
catgetgg 
geacagatge 
ctcgctgcgc 
aeggttatec 
aaaggecagg 
tgacgagcat 
aagataccag 
gettacegga 
aegctgtagg 
accccccgtt 
ggtaagacac 
gtatgtaggc 
gacagtattt 
ctcttgatcc 
gattacgege 
cgctcagtgg 
cttcacctag 
tttcgtgccg 
gaccttcacg 
cgcgctggag 
ccgagctctc 

M/43128 



cgc 



ccttcgcgaa 
caagcttctt 
aatcgtcccc 
accgacttga 
ccacgcgtca 
ttaattaaca 
aageggaaca 
tactgggcta 
gggcttacat 
ccagctgggg 
ttgccgccaa 
tegtttcgea 
aggctattcg 
cggctgtcag 
aatgaactgc 
gcagctgtgc 
ceggggcagg 
gatgeaatge 
aaacatcgea 
ctggacgaag 
atgcccgacg 
gtggaaaatg 
tatcaggaca 
gaccgcttcc 
cgccttcttg 
cgcccaacct 
teggaategt 
agttcttcgc 
gtaaggagaa 
teggtegtte 
acagaatcag 
aacegtaaaa 
cacaaaaatc 
gcgtttcccc 
tacctgtccg 
tatctcagtt 
cagcccgacc 
gaettatege 
ggtgctacag 
ggtatctgcg 
ggcaaacaaa 
agaaaaaaag 
aacgaaaact 
atccttttaa 
cgtgattttc 
acgaagtact 
tccgacgcgc 
gatacgaegg 



gccttgcccc 
tcaccctaaa 
tgatcgccct 
tcagcggccg 
tatgactagt 
attgggatcc 
egtagaaage 
tctggacaag 
ggegataget 
cgccctctgg 
ggatctgatg 
tgattgaaca 
gctatgactg 
cgcaggggcg 
aggacgaggc 
tcgacgttgt 
atctcctgtc 

ggeggctgea 

tegagegage 
agcatcaggg 
gegaggatet 
gccgcttttc 
tagcgttggc 
tegtgettta 
acgagttctt 
gccatcacga 
tttcegggae 
ccacgctagc 
aatacegcat 
ggctgcggcg 
gggataaege 
aggecgegtt 
gaegctcaag 
ctggaagctc 
cctttctccc 
cggtgtaggt 
gctgcgcctt 
cactggcagc 
agttcttgaa 
etctgetgaa 
ccaccgctgg 
gatctcaaga 
caegttaagg 
aggccggccg 
cgccaaaaac 
aaaattggcc 
tegatgetge 
acgcgccagc 



gcggaaattt 
ttcgagagat 
tgcgacgttg 
ctcgatttaa 
teggacctag 
tctagacccg 
cagtccgcag 
ggaaaacgea 
agactgggcg 
taaggttggg 
gcgcagggga 
agatggattg 
ggcacaacag 
cccggttctt 
agegeggcta 
cactgaagcg 
atctcacctt 
tacgettgat 
aegtactegg 
gctcgcgcca 
cgtcgtgacc 
tggattcatc 
taccegtgat 
cggtatcgcc 
ctgagcggga 
gatttcgatt 
gccggctgga 
ggcgcgccgg 
caggcgctct 
ageggtatea 
aggaaagaac 
gctggcgttt 
tcagaggtgg 
cctcgtgcgc 
ttegggaage 
cgttcgctcc 
ateeggtaac 
agccactggt 
gtggtggcct 
gccagttacc 
tagcggtggt 
agatcctttg 
gattttggtc 
cggccgcgca 
tttaacgaac 
cgaatcatca 
cgtcgattta 
atcacgagac 



cctccaccga 
tggattctta 
gcgtcggtgc 
atctcgagag 
ggatatcgtc 
ggatttaaat 
aaacggtgct 
agegcaaaga 
gttttatgga 
aagccctgca 
tcaagatctg 
caegcaggtt 
acaategget 
tttgtcaaga 
tcgtggctgg 
ggaagggact 
gctcctgccg 
ccggctacct 
atggaagccg 
gecgaactgt 
catggcgatg 
gactgtggcc 
attgetgaag 
gctcccgatt 
ctctggggtt 
ccaccgccgc 
tgatcctcca 
ccggcccggt 
tccgcttcct 
gctcactcaa 
atgtgagcaa 
ttccataggc 
cgaaacccga 
tctcctgttc 
gtggcgcttt 
aagctgggct 
tategtcttg 
aacaggatta 
aactaegget 
ttcggaaaaa 
ttttttgttt 
atcttttcta 
atgagattat 
aagtcccgct 
gttcgttata 
gctatggatc 
aaaacggtga 
tgggccagtg 



gttcgtgcac 
ccgtggaaat 
cgctggttgc 
gcctgacgtc 
gacatcgatg 
cgctagcggg 
gaccccggat 
gaaagcaggt 
cagcaagega 
aagtaaactg 
atcaagagac 
ctccggccgc 
getctgatge 
ccgacctgtc 
ccacgacggg 
ggctgetatt 
agaaagtatc 
gcccattcga 
gtcttgtcga 
tcgccaggct 
cctgcttgcc 
ggctgggtgt 
agettggegg 
cgcagcgcat 
cgaaatgacc 
cttctatgaa 
gegeggggat 
gtgaaatacc 
cgctcactga 
a 99cggtaat 
aaggecagea 
tccgcccccc 
caggactata 
cgaccctgcc 
ctcatagctc 
gtgtgcacga 
agtccaaccc 
geagagegag 
acactagaag 
gagttggtag 
gcaagcagca 
eggggtctga 
caaaaaggat 
tcgtgaaaat 
atggtgtcat 
tctctgatgt 
teggattttt 
ccgcgagcga 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 
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cctagaaact 
gccaggagga 
tcctccccgg 
cgcagccagc 
gcaaatggcg 
ggaagcggca 
aaatgccgcg 
ccgaatcggc 
gcacgaatac 
acccccagtc 
ttgacacacc 
tgcgatcacg 
aaaatttcca 
cggagaaaca 
tgttgctctg 
ccaccaggcc 
ctgggcacgc 
ccagctcatc 
gcgcctgctg 
ttcacatagg 
cccagcac 
gcacagaa 
gaagcggca 
gccgagcgcc 
tccagggcgt 
gttaaaagcg 
ctacaccgtc 
ccgccagacg 
ccctgctcgt 
aagacgtggc 
agcacagcga 
tcgcttgacc 
aatcaatgaa 
ggtctgcggg 
cgtaggcaga 
tgattgctct 
gctcgcctcg 



ctcgtggcgg 

cgcacagtag 

cctgacccgc 

cgcgagcgcg 

ctggaagtgc 

gcgagaatta 

tttcgtgtgc 

agcagcgtcg 

ctgaaaaatg 

caaacctggg 

ggcctggaaa 

tggctggacg 

gggcagcaag 

cagccgaagt 

acgcacgcgc 

ggcgggaaaa 

ctggaaaaag 

tggctcattg 

gctgcaacga 

ctgagccgtg 

aatcgcgtgg 

aaacctaaaa 

agaaaagcca 

gctgaagcgt 

gccgcccgtg 

gctggtgagc 

gctcaggcgg 

gattggccgc 

cagacagaga 

ggtaaaaagg 

gaaaaactag 

attgcaggtt 

gctatgtctg 

cattgaactt 

aaacggttcc 

tgaagctctc 

taagcgcaca 



atcttgagga 

tggaggatgc 

gaggacggcg 

ccaacaaacg 

gtcccccgag 

tcgcgatcgt 

cgtggccgcc 

cgcgtcgaaa 

ttgaacgccc 

agaaagcgct 

ttttccgctg 

agcgaagacc 

acccgcgact 

tataccgagt 

agcacgcagc 

tcgagcacgt 

cgccagcttg 

atccggtgta 

ccgaggaaat 

gccactgcac 

atcgcctagc 

aacgctatga 

ctgcggaagc 

ctggagagct 

atgagacggc 

gcctaaaaga 

tcggaggagg 

gacgtgtgcg 

cgcagagcca 

ccgcagaacg 

ctaagtccag 

ggtttatgac 

aatttagcgt 

ccacgaggac 

cccgtagggt 

taggggggct 

aggactgctc 



gctggctgac 
aatcagttgc 
cgcaaaatat 
ccacgccgag 
cgaaattttg 
ggcggtgccc 
caggacgtgt 
aagcgcacag 
cgtgagcggt 
caaaaatgac 
atctgttcga 
gccgcgaatt 
tcgccagcgc 
tggttcaaaa 
cgtgcttgtc 
aaaccccgag 
gatcggcgtg 
tgccgcagca 
gacccgcgtt 
tctccgacga 
tgatcttatg 
gcaggagttt 
aaaagcactt 
gatcgacggc 
ttttcgccac 
caccaagggt 
ccgtgagcct 
cggctacgtc 
gccgaggcga 
ctggaaagac 
tcaacgacaa 
tgttgaggga 
gtcacgtcag 
gccgaaagct 
ctctctcttg 
cacaccatag 
ccaaagatct 



gagctgcgtg 
gcctactgcg 
tgctcagatg 
gagctggagg 
gccatggtcg 
gcaggcatga 
cagcgccgcc 
gcggcaagaa 
aactcacagg 
tctagcggat 
cacccatccc 
cctcgctcac 
ttggatcaaa 
tcgcttgccc 
ctggacattg 
gtctacgcga 
aatccactga 
ggcatgagca 
tteggcgctg 
tcccagccgt 
gaggttgctc 
tctagcggac 
gccacgcttg 
gtccgtgtcc 
gctttgactg 
catcgagcct 
gatctgccgc 
gctaaaggcc 
aaagctctgg 
ccaaacagtg 
gctaggaaag 
gagactggct 
accgtgaata 
tcccagtaaa 
gcctcctttc 
gcagataacg 
tcaaagccac 



ctcggccagc 
gtggcctgat 
cgtgtcgtgc 
cggctaggtc 
tcacagagct 
caaacatcgt 
accacctgca 
gcgataagct 
gcgtcggcta 
tcacgagaca 
gagctcgcgc 
ctgggcagag 
gacccggaca 
ggtgccagta 
atgtgccgag 
ttttggagcg 
gcgggaaatg 
gcccgaatat 
accaggcttt 
accgctggca 
gcatgatctc 
gggcacgtat 
aagcaagcct 
tctggactgc 
tgggatacca 
acgagcgtgc 
cggactgtga 
agccagtcgt 
ccactatggg 
agtacgcccg 
ctaaaggaaa 
cgtggccgac 
gagcacttaa 
tgtgccatct 
taggtcgggc 
ttccccaccg 
t 



2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5091 



«0> 66 
1> 4323 
2> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Plasmid 
<400> 66 

tctctcagcg tatggttgtc gcctgagctg tagttgcctt catcgatgaa ctgctgtaca 60 
ttttgatacg tttttccgtc accgtcaaag attgatttat aatcctctac accgttgatg 120 
ttcaaagagc tgtctgatgc tgatacgtta acttgtgcag ttgtcagtgt ttgtttgccg 180 
taatgtttac cggagaaatc agtgtagaat aaacggattt ttccgtcaga tgtaaatgtg 24 0 
gctgaacctg accattcttg tgtttggtct tttaggatag aatcatttgc atcgaatttg 300 
tcgctgtctt taaagacgcg gccagcgttt ttccagctgt caatagaagt ttcgccgact 360 
ttttgataga acatgtaaat cgatgtgtca tccgcatttt taggatctcc ggctaatgca 420 
aagacgatgt ggtagccgtg atagtttgcg acagtgccgt cagcgttttg taatggccag 480 
ctgtcccaaa cgtccaggcc ttttgcagaa gagatatttt taattgtgga cgaatcaaat 540 
tcagaaactt gatatttttc atttttttgc tgttcaggga tttgcagcat atcatggcgt 600 
gtaatatggg aaatgccgta tgtttcctta tatggctttt ggttcgtttc tttcgcaaac 660 
gcttgagttg cgcctcctgc cagcagtgcg gtagtaaagg ttaatactgt tgcttgtttt 720 
gcaaactttt tgatgttcat cgttcatgtc tcctttttta tgtactgtgt tagcggtctg 780 
cttcttccag ccctcctgtt tgaagatggc aagttagtta cgcacaataa aaaaagacct 840 
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aaaatatgta aggggtgacg ccaaagtata cactttgccc tttacacatt ttaggtcttg 900 

cctgctttat cagtaacaaa cccgcgcgat ttacttttcg acctcattct attagactct 960 

cgtttggatt gcaactggtc tattttcctc ttttgtttga tagaaaatca taaaaggatt 1020 

tgcagactac gggcctaaag aactaaaaaa tctatctgtt tcttttcatt ctctgtattt 1080 

tttatagttt ctgttgcatg ggcataaagt tgccttttta atcacaattc agaaaatatc 1140 

ataatatctc atttcactaa ataatagtga acggcaggta tatgtgatgg gttaaaaagg 1200 

atcggcggcc gctcgattta aatctcgaga ggcctgacgt cgggcccggt accacgcgtc 1260 

atatgactag ttcggaccta gggatatcgt cgacatcgat gctcttctgc gttaattaac 132 0 

aattgggatc ctctagaccc gggatttaaa tcgctagcgg gctgctaaag gaagcggaac 13 80 

acgtagaaag ccagtccgca gaaacggtgc tgaccccgga tgaatgtcag ctactgggct 1440 

atctggacaa gggaaaacgc aagcgcaaag agaaagcagg tagcttgcag tgggcttaca 1500 

tggcgatagc tagactgggc ggttttatgg acagcaagcg aaccggaatt gccagctggg 1560 

gcgccctctg gtaaggttgg gaagccctgc aaagtaaact ggatggcttt cttgccgcca 1620 

aggatctgat ggcgcagggg atcaagatct gatcaagaga caggatgagg atcgtttcgc 1680 

atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 1740 

ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 1800 

gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 1860 

caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 1920 

ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 1980 

catctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 204 0 

/■•wpcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 2100 

^■Wcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 2160 

^^jagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac 2220 

ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 2280 

ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 2340 

atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 2400 

ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 2460 

gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg acgcccaacc 2520 

tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 2580 

ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 2 640 

cccacgctag cggcgcgccg gccggcccgg tgtgaaatac cgcacagatg cgtaaggaga 2700 

aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 2760 

cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 2820 

ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 2 880 

aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 294 0 

cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 3000 

cctggaagct ccctcgtgcg ctptcctgtt ccgaccctgc cgcttaccgg atacctgtcc 3060 

gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 3120 

tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 3180 

^^rctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 3240 

^Bj^ctggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 3300 

l^Kj^ tctt 9 a agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 3 3 60 

^Ptctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 342 0 

accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 34 80 

ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 3540 

tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta 3600 

aaggccggcc gcggccgcca tcggcatttt cttttgcgtt tttatttgtt aactgttaat 3660 

tgtccttgtt caaggatgct gtctttgaca acagatgttt tcttgccttt gatgttcagc 3720 

aggaagctcg gcgcaaacgt tgattgtttg tctgcgtaga atcctctgtt tgtcatatag 3780 

cttgtaatca cgacattgtt tcctttcgct tgaggtacag cgaagtgtga gtaagtaaag 3840 

gttacatcgt taggatcaag atccattttt aacacaaggc cagttttgtt cagcggcttg 3 900 

tatgggccag ttaaagaatt agaaacataa ccaagcatgt aaatatcgtt agacgtaatg 3 960 

ccgtcaatcg tcatttttga tccgcgggag tcagtgaaca ggtaccattt gccgttcatt 4 020 

ttaaagacgt tcgcgcgttc aatttcatct gttactgtgt tagatgcaat cagcggtttc 4080 

atcacttttt tcagtgtgta atcatcgttt agctcaatca taccgagagc gccgtttgct 4140 

aactcagccg tgcgtttttt atcgctttgc agaagttttt gactttcttg acggaagaat 4200 

gatgtgcttt tgccatagta tgctttgtta aataaagatt cttcgccttg gtagccatct 4260 

tcagttccag tgtttgcttc aaatactaag tatttgtggc ctttatcttc tacgtagtga 4320 
99 a 4323 
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